Anthropic Виявляє Три Зміни На Рівні Продукту, Що Стоять За Падінням Якості Claude Code, А Не Проблему Моделі

Повідомлення Gate News, 23 квітня — інженерна команда Anthropic підтвердила, що погіршення якості Claude Code, про яке повідомляли користувачі протягом минулого місяця, було спричинене трьома незалежними змінами на рівні продукту, а не проблемами API чи базової моделі. Три проблеми були виправлені відповідно 7 квітня, 10 квітня та 20 квітня, а нинішня фінальна версія має v2.1.116.

Перша зміна сталася 4 березня, коли команда зменшила рівень зусиль за замовчуванням для міркувань Claude Code з “high” до “medium”, щоб усунути епізодичні надмірні піки затримок у Opus 4.6 за високої інтенсивності міркувань. Після численних скарг користувачів на зниження продуктивності команда повернула цю зміну 7 квітня. Нині поточне значення за замовчуванням — “xhigh” для Opus 4.7 і “high” для інших моделей.

Друга проблема була багом, внесеним 26 березня. Система була спроєктована очищати старі записи міркувань після того, як бездіяльність у розмові перевищувала одну годину, щоб зменшити витрати на відновлення сесії. Однак недолік у реалізації спричинив те, що очищення виконувалося повторно на кожному наступному ході, а не один раз, через що модель поступово втрачала попередній контекст міркувань. Це проявлялося як зростаюча забудькуватість, повторювані операції та ненормальні виклики інструментів. Баг також спричинив збіги кешу на кожен запит, пришвидшуючи витрачання квот користувачів. Два не пов’язані з цим внутрішні експерименти приховали умови відтворення, розтягнувши процес дебагу більш ніж на тиждень. Після виправлення 10 квітня команда переглянула проблемний код, використовуючи Opus 4.7, і виявила, що Opus 4.7 може ідентифікувати цей баг, тоді як Opus 4.6 — ні.

Третя зміна була запущена 16 квітня разом із Opus 4.7. Команда додала інструкції до системного промпту, щоб зменшити надмірний повторюваний вивід. Внутрішнє тестування протягом кількох тижнів показало відсутність регресії, але після запуску взаємодія з іншими промптами погіршила якість кодування. Розширене оцінювання виявило 3% падіння продуктивності в обох випадках — Opus 4.6 і 4.7 — що призвело до відкату 20 квітня.

Ці три зміни вплинули на різні групи користувачів у різний час, а їхня сукупна дія спричинила поширене та непослідовне падіння якості, ускладнивши діагностику. У Anthropic заявили, що тепер для використання того самого публічного номера версії збірки, що й у користувачів, знадобиться задіяти більше внутрішніх співробітників, виконувати повні комплекти оцінювання моделей для кожної модифікації системного промпту та впроваджувати етапні періоди розгортання. Як компенсацію, Anthropic скинув квоти використання для всіх передплатників.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Cohere придбає німецьку компанію в галузі ШІ Aleph Alpha та забезпечує $600M інвестицій для європейської експансії

Повідомлення Gate News, 24 квітня — канадська компанія в галузі ШІ Cohere оголосила про плани придбати німецьку компанію в галузі ШІ Aleph Alpha, щоб посилити свою присутність у Європі. Schwarz Group, інвестор Aleph Alpha, планує інвестувати $600 мільйонів у раунд фінансування Series E Cohere. Очікується, що раунд фінансування буде завершено в 202

GateNews24хв. тому

Xpeng і Xiaomi очолюють поштовх у бортовий ШІ на Пекінському автосалоні

Повідомлення Gate News, 24 квітня — Китайські автовиробники показали передові вбудовані в авто системи ШІ на Пекінському автосалоні 24 квітня, оскільки країна прискорює свою стратегію AI Plus та прагне більшої незалежності від іноземних напівпровідників. Xpeng продемонструвала голосокероване паркування, яке дозволяє водіям «

GateNews1год тому

Колишній інженер Seed у ByteDance: ітерації AI у ByteDance тривають шість місяців проти трьох у Google

Повідомлення Gate News, 24 квітня — Чжан Чі, колишній інженер команди Seed у ByteDance та нинішній доцент Пекінського університету, розповів у подкасті "Into Asia", що ByteDance потрібно приблизно шість місяців, щоб завершити один повний цикл тренування великих мовних моделей (pretraining

GateNews1год тому

Інженер OpenAI Клайв Чан Оскаржує Рекомендації щодо Апаратного Забезпечення V4, Посилаючись на Помилки та Невизначеність Порівняно з V3

Повідомлення Gate News, 24 квітня — інженер OpenAI Клайв Чан висунув детальні заперечення до розділу з рекомендаціями щодо апаратного забезпечення у технічному звіті V4, назвавши його "дивовижно посереднім і таким, що схильний до помилок" порівняно з відомою версією V3. Апаратні рекомендації V3, які включали сесії Q&A

GateNews1год тому

Naver запускає бета-версію AI Tab, коли Google Gemini виходить на ринок пошуку Південної Кореї

Повідомлення Gate News, 24 квітня — Naver оголосила про старт закритої бета-версії AI Tab, її нової функції розмовного пошуку, після запуску Google Gemini у Chrome в Південній Кореї. AI Tab з’явиться поруч із наявними вкладками пошуку Naver, надаючи користувачам окремий простір для розмовних

GateNews2год тому

Індія: найм у сфері AI-інжинірингу стрімко зростає на 59,5%, виходить за межі технопарків

AI Labor Market Report 2026 від LinkedIn, опублікований 24 квітня, виявив, що найм AI-інженерів в Індії зріс на 59,5% у річному обчисленні, що стало найшвидшими темпами серед ринків, досліджених платформою. Зростання було зумовлено тим, що попит поширився за межі усталених технологічних центрів. Міста, зокрема

CryptoFrontier2год тому
Прокоментувати
0/400
Немає коментарів