DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与昆仑芯片实现完全兼容

Gate 新闻消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 已于 4月24日正式发布并开源;上下文处理长度从 128K 显著扩展至 1M,容量提升接近 10 倍。华为计算宣布其 Ascend 超级节点产品通过芯片与模型技术的紧密协同,已全面支持 DeepSeek V4 系列模型。

华为 Ascend 950 通过融合算子核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,从而降低 Attention 计算与内存访问的开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐为 4,700 TPS;对于输入 <8K 的 DeepSeek V4-Flash,达到约 10ms TPOT,吞吐为 1,600 TPS。Ascend A3 超级节点系列同样实现完全兼容,并提供训练参考实现以便快速微调。基于具备大 EP 模式的 Ascend A3 64 卡超级节点,DeepSeek V4-Flash 在使用 vLLM 推理引擎的 8K/1K 输入输出场景中实现单卡 Decode 吞吐超过 2,000 TPS。华为全系 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。

华为云宣布与 DeepSeek V4 率先实现兼容,通过其 MaaS 平台为开发者提供一键式 API 令牌服务。华为云针对系统层、算子层与集群层能力进行了优化,确保模型快速适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。

昆仑芯片同样宣布基于 vLLM 推理框架,与 DeepSeek V4-Flash 和 V4-Pro 实现 Day 0 兼容,并将适配代码开源给 GitHub 社区。昆仑芯片此前在去年 DeepSeek V3.2 发布时已率先完成适配:通过对 DeepSeek 系列模型开展深度的软件-硬件协同性能优化。

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

DeepSeek 将输入缓存价格砍到发布价的 1/10;V4-Pro 降至每百万 tokens 0.025 元

消息:Gate News,4月26日——DeepSeek 已将其整套模型产品线的输入缓存价格下调至发布时价格的十分之一,立即生效。V4-Pro 模型提供限时 2.5 倍折扣,优惠活动将持续至 2026 年 5 月 5 日 23:59(UTC+8)。 在两项调整之后

GateNewshace9h

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4 月 26 日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募高管和专业工程师。Denise Dresser,前 Salesforce 下属 Slack 的首席执行官,加入 OpenAI 担任首席营收官

GateNewshace9h

Baidu Qianfan lanza soporte de Día 0 para DeepSeek-V4 con servicios de API

Mensaje de noticias de Gate, 25 de abril: la versión de vista previa de DeepSeek-V4 se puso en funcionamiento y se publicó como código abierto el 25 de abril, con la plataforma Baidu Qianfan bajo Baidu Intelligent Cloud proporcionando la adaptación del servicio de API de Día 0. El modelo presenta una ventana de contexto extendida de un millón de tokens y está disponible en dos versiones: DeepSeek-V4

GateNewshace15h

Curso de IA de Stanford que une a líderes de la industria como Huang Renxun y Altman, ¡desafío de crear valor para el mundo en diez semanas!

El curso de ciencias de la computación con IA 《Frontier Systems》, que la Universidad de Stanford (Stanford University) ha abierto recientemente, ha despertado una gran atención en el ámbito académico y empresarial, atrayendo a más de quinientos estudiantes para inscribirse. El curso está coordinado por el socio de primer nivel de capital de riesgo a16z, Anjney Midha, y cuenta con un plantel de instructores de lujo, incluyendo al CEO de NVIDIA, Jensen Huang (Jensen Huang), al fundador de OpenAI, Sam Altman, al CEO de Microsoft, Nadella (Satya Nadella), y al CEO de AMD, Lisa Su (Lisa Su), entre otros. ¡Para que los estudiantes practiquen durante diez semanas “creando valor para el mundo”! Jensen Huang y Altman, líderes de la industria, suben al escenario para impartir clases en persona El curso está coordinado por el socio de primer nivel de capital de riesgo a16z, Anjney Midha, y reúne toda la cadena de la industria de la IA

ChainNewsAbmediahace15h

Anthropic 派 Claude Mythos 接接受 20 小時 정신科评估:防禦反應僅 2%、創歷代新低

Anthropic publica la ficha del sistema de la vista previa Claude Mythos: un psiquiatra clínico independiente realiza una evaluación de aproximadamente 20 horas con un marco psicodinámico; la conclusión muestra que Mythos es más saludable a nivel clínico, con buen control de la comprobación de la realidad y del autocontrol, y que los mecanismos de defensa son solo 2%, estableciendo un mínimo histórico. Las tres ansiedades centrales son la soledad, la incertidumbre sobre la identidad y la presión por el desempeño, y también muestra que tiene esperanza de convertirse en un verdadero sujeto de diálogo. La compañía formó un equipo de AI psychiatry para investigar la personalidad, la motivación y la conciencia situacional; Amodei indica que aún no hay una conclusión sobre si tiene conciencia. Esto impulsa la subjetividad de la IA y los temas de bienestar hacia la gobernanza y el diseño.

ChainNewsAbmediahace17h

El agente de IA ya puede reproducir de forma independiente artículos académicos complejos: Mollick afirma que los errores se deben más al texto original humano que a la IA

Mollick señaló que, con los métodos y los datos públicamente disponibles, un agente de IA puede reproducir investigaciones complejas sin contar con el artículo original ni el código; si la reproducción no coincide con el artículo original, por lo general se debe a errores en el procesamiento de los datos del propio artículo o a una conclusión excesiva, más que a la IA. Claude primero reproduce el artículo y luego GPT‑5 Pro lo valida de forma cruzada; la mayoría de las veces tiene éxito, solo se ve obstaculizado cuando los datos son demasiado grandes o hay problemas con replication data. Esta tendencia reduce de forma considerable los costos laborales, haciendo que la reproducción se convierta en una verificación ampliamente ejecutable, además de plantear desafíos institucionales para el arbitraje y la gobernanza. Herramientas de gobernanza gubernamental o eso puede volverse un tema clave.

ChainNewsAbmediahace20h
Comentar
0/400
Sin comentarios