ゲートニュース 4月24日 — DeepSeek V4-Pro と DeepSeek V4-Flash は 4月24日に正式にリリースされ、オープンソース化されました。コンテキスト処理長は 128K から 1M へ大幅に拡張され、ほぼ10倍の収容能力増を示しています。Huawei Computing は、その Ascend スーパーノード製品が、チップとモデル技術間の緊密な連携により、DeepSeek V4 シリーズのモデルを完全にサポートすると発表しました。
Huawei Ascend 950 は、融合カーネルおよびマルチストリーム並列化手法により、Attention の計算とメモリアクセスのオーバーヘッドを削減し、高スループット・低遅延の DeepSeek V4 モデル推論デプロイメントを実現します。8K 入力の DeepSeek V4-Pro では、Ascend 950 は約 20ms TPOT、単一カード Decode スループット 4,700 TPS を達成します。8K 入力の範囲で、DeepSeek V4-Flash は約 10ms TPOT、スループット 1,600 TPS に到達します。Ascend A3 スーパーノードシリーズも完全な互換性を実現しており、迅速なファインチューニングのためのトレーニング参照実装が提供されています。大規模 EP モードの Ascend A3 64カード スーパーノードに基づき、DeepSeek V4-Flash は vLLM 推論エンジンを用い、8K/1K の入出力シナリオで単一カード Decode スループット 2,000 TPS 超を実現します。Huawei の完全な Ascend A2、A3、950 の製品ラインは、DeepSeek V4-Flash と V4-Pro の両方をサポートします。
Huawei Cloud は DeepSeek V4 とのファーストムーバー互換性を発表し、MaaS プラットフォームを通じて開発者にワンクリック API トークンサービスを提供します。Huawei Cloud は、システム層、オペレータ層、クラスター層の能力を最適化し、迅速なモデル適応と高性能なデプロイメントを確実にします。Kingsoft WPS や 360 を含む企業は、すでに Huawei Cloud 経由で DeepSeek の新モデルを統合しています。
Cambricon もまた、vLLM 推論フレームワークに基づき、DeepSeek V4-Flash と V4-Pro に対する Day 0 互換性を発表しました。適応コードは GitHub コミュニティにオープンソース化されています。Cambricon は以前、昨年 DeepSeek V3.2 がリリースされた際にもファーストムーバーの適応を達成しており、DeepSeek シリーズモデルに対して深いソフトウェア—ハードウェアの協調パフォーマンス最適化を実施しました。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
GPT-5.5がコーディングの最前線に復帰、しかしOpenAIはOpus 4.7に敗れた後でベンチマークを切り替え
ゲートニュース 4月27日 — 半導体およびAI分析企業のSemiAnalysisは、GPT-5.5、Claude Opus 4.7、DeepSeek V4を含むコーディングアシスタントの比較ベンチマークを公開した。主要な発見:GPT-5.5は、コーディングモデルにおいて、OpenAIが6か月ぶりに最先端へ戻ったことを示す。S
GateNews2分前
Google DeepMind幹部:すべてのAIプロダクト企業はカスタムベンチマークを構築すべき
ゲートニュース 4月27日 — Google DeepMindのシニア・プロダクトマネージャーであり、Google AI Studioのプロダクトリードでもあるローガン・キルパトリックは、Xで、AIベースのプロダクトを構築するすべての企業は、AIモデルの性能を測るために自社のカスタムベンチマークを確立すべきだと述べた。彼はこれを、モデルの改善が「自社に不釣り合いなほど大きな利益をもたらす」ための方法だと説明し、創業者やビジネスリーダーに「明日から始めるよう」促した。彼はこれを
GateNews1時間前
聯発科がGoogleの第8世代TPUの大口案件を獲得!ASICの発酵がきっかけで3つの関連銘柄が恩恵を受ける
MediaTekがGoogleの第8世代TPU学習チップ供給チェーンに参入し、I/O Dieの設計を担い、さらに台積電のN3PとCoWoS-Sのパッケージングを採用することで、高度なAI ASIC設計レベルにまで到達していることを示している。今年のASICの売上高は10億ドルを超える見込みで、TPUの出荷台数は2027年に向けて千数百万個に達する可能性がある。京元電子、精測、鴻勁などの台湾のサプライチェーンも恩恵を受け、市場は徐々に分業協業とchiplet、異種統合の未来へと移行していく。
ChainNewsAbmedia1時間前
SingtelのRE:AIがミストラルAIと提携し、シンガポールでAIインフラを開発
ゲートニュース、4月27日 — シンガポール拠点のデジタルインフラ部門であるRE:AIが、ミストラルAIと提携し、シンガポールの産業向けのAI機能を支援することを、シンガポール通信グループ(Singtel Group)が発表しました。
この提携では、金融
GateNews1時間前
ヘ・イーのYZi Labs、中国のAI大規模言語モデル企業に投資
ゲートニュースのメッセージ、4月27日 — ヘ・イーは、チャンポン・チャオのファミリーオフィスであるYZi Labsとともに、中国の人工知能の大規模言語モデル企業に投資したと、香港Web3カーニバルでの非公開KOL(キーオピニオンリーダー)集会で明かした。投資先企業の具体的な名称は開示されなかった。
GateNews1時間前
MediaTekおよびQualcommと提携したOpenAIがAIスマートフォン用プロセッサを開発、Foxconn Connectorは2028年に量産開始へ
ゲートニュース、4月27日—Tianfeng International SecuritiesアナリストのMing-Chi Kuoによるサプライチェーン分析によると、OpenAIはMediaTekおよびQualcommと協力してスマートフォン向けプロセッサを開発している。Foxconn Connector (Luxshare Precision)は、独占的なシステム設計および
GateNews1時間前