ゲートニュース(4月23日)— アンソロピックのエンジニアリングチームは、過去1か月間にユーザーから報告されたClaude Codeの品質低下は、APIや基盤となるモデルの問題ではなく、3つの独立したプロダクト層の変更に起因することを確認した。3つの問題はそれぞれ4月7日、4月10日、そして4月20日に修正され、最終版は現在v2.1.116となっている。
最初の変更は3月4日に発生した。チームは、推論の強度が高いOpus 4.6で、ときおり極端なレイテンシのスパイクが発生するのを抑えるため、Claude Codeのデフォルトの推論エフォートレベルを「high」から「medium」に引き下げた。パフォーマンス低下に関する広範なユーザーの不満を受けて、チームは4月7日にこの変更を元に戻した。現在のデフォルトは、Opus 4.7は「xhigh」、その他のモデルは「high」となっている。
2つ目の問題は3月26日に導入されたバグだった。システムは、会話が1時間以上非アクティブになると古い推論レコードを消去して、セッション復旧コストを下げるよう設計されていた。しかし実装上の欠陥により、消去がその後のすべてのターンで繰り返し実行される一方で、1回だけ実行されるべきところが、そのためにモデルが以前の推論コンテキストを段階的に失っていく原因になった。これは、忘れっぽさの増加、繰り返し操作、異常なツール呼び出しとして現れた。このバグはまた、すべてのリクエストでキャッシュミスを発生させ、ユーザーの利用クォータ消費を加速させた。再現条件を覆い隠す、互いに関係のない2つの社内実験が行われたため、デバッグが1週間以上に及んだ。4月10日に修正した後、チームはOpus 4.7を使って問題のあるコードをレビューし、Opus 4.7ならバグを特定できる一方でOpus 4.6ではできないことを確認した。
3つ目の変更は、Opus 4.7とともに4月16日にリリースされた。チームは冗長な出力を減らすために、システムプロンプトに指示を追加した。数週間にわたる社内テストでは回帰は見られなかったが、リリース後に他のプロンプトとのやり取りを行うと、コーディング品質が低下した。拡張評価では、Opus 4.6と4.7の両方でパフォーマンスが3%低下していることが判明し、4月20日にロールバックが行われた。
これら3つの変更は、異なる時期に異なるユーザーグループに影響し、その組み合わせによって広範で一貫性のない品質低下が生まれ、診断を難しくした。アンソロピックは今後、ユーザーと同じ公開ビルドバージョンを使うために、より多くの社内従業員を必要とし、すべてのシステムプロンプト変更について完全なモデル評価スイートを実行し、段階的ロールアウトの期間を設けると述べた。補償として、アンソロピックはすべてのサブスクリプションユーザーの利用クォータをリセットした。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
CohereがドイツのAI企業Aleph Alphaを買収、欧州展開に向けて$600M 投資を確保
Gate Newsメッセージ、4月24日—カナダのAI企業Cohereは、欧州での存在感を強化するため、ドイツのAI企業Aleph Alphaを買収する計画を発表した。Aleph Alphaの支援者であるSchwarz Groupは、CohereのSeries Eの資金調達ラウンドで$600 百万ドルを投資する予定だ。
この資金調達ラウンドは202でクローズする見込み
GateNews24分前
XpengとXiaomiが北京モーターショーで車載AI推進をリード
ゲートニュース、4月24日——中国の自動車メーカーは、4月24日の北京モーターショーで先進的な車載AIシステムを披露した。同国はAI Plus戦略を加速し、海外の半導体への依存度を高めることを目指している。
Xpengは、運転者が手動で場所を選択する代わりに、話しかけて指示できる音声制御の駐車を披露した、
GateNews1時間前
元ByteDance Seedエンジニア:ByteDanceのAI反復は6か月、Googleは3か月
Gate Newsメッセージ、4月24日 — ByteDanceのSeedチーム出身の元エンジニアであり、現在は北京大学の助教でもある張馳氏が、ポッドキャスト『Into Asia』で、ByteDanceが大規模言語モデルの学習(pretrainingを1サイクル完了するのに約6か月を要するほか、事後学習も必要だと明らかにした。一方でGoogleは、報道によればわずか3か月で済む。張氏は、このスピードの違いが、中国企業がAI開発で追いつけないことの根本的な理由の1つだとした
GateNews1時間前
OpenAIエンジニアのクライブ・チャンが、V3との比較で誤りと曖昧さを挙げてV4のハードウェア推奨を問題視
ゲート・ニュース 4月24日 — OpenAIのエンジニア、クライブ・チャン(Clive Chan)は、V4の技術レポートにおけるハードウェア推奨章に対して、詳細な異議を提起した。称賛されるV3版と比べて「驚くほど出来が悪く、エラーが起きやすい」と述べている。V3のハードウェア指針には、Q&Aセッションが含まれており
GateNews1時間前
ネイバー、AI Tabベータを開始 GoogleのGeminiが韓国の検索市場に参入
ゲートニュース、4月24日 — ネイバーは、新しい会話型検索機能「AI Tab」のクローズドベータ開始を発表しました。これは、韓国でGoogleがChromeにGeminiを導入したことを受けてのものです。
AI Tabは、ネイバーの既存の検索タブと並んで表示され、ユーザーに会話によるクエリ専用のスペースを提供します。
GateNews2時間前
インドでAIエンジニア採用が59.5%急増、テック拠点の外へ拡大
LinkedInのAI労働市場レポート2026は4月24日にリリースされ、インドでのAIエンジニアリング採用が前年比59.5%増加したことを明らかにしました。同プラットフォームが調査した市場の中で最速のペースを示しています。
成長は、需要が確立されたテック拠点の外へ広がったことによってもたらされました。都市としては、これらを含みます。
CryptoFrontier2時間前