Mensaje de Gate News, 24 de abril — El ingeniero de OpenAI, Clive Chan, ha presentado objeciones detalladas al capítulo de recomendaciones de hardware en el informe técnico V4, calificándolo de “sorprendentemente mediocre y propenso a errores” en comparación con la versión V3 aclamada. La guía de hardware de V3, que incluía sesiones de Q&A que se convirtieron en el tema de discusión más popular en la conferencia académica ISCA, ofreció recomendaciones específicas alineadas con los estándares de interconexión de la industria. En cambio, V4 es mucho más vaga.
Chan cuestionó sistemáticamente tres recomendaciones clave. Sobre el consumo de energía, el informe sugiere que la optimización del software permite que los chips ejecuten cómputo, almacenamiento y comunicación al mismo tiempo al máximo, y recomienda que los fabricantes de chips reserven margen adicional de potencia. Chan sostiene que esto es contraproducente: la potencia total del chip está limitada por restricciones físicas del proceso, así que reservar más margen de potencia solo reduce la frecuencia de operación, disminuyendo en última instancia el rendimiento computacional. En cuanto a la transferencia de datos de GPU a GPU, el informe aboga por un modelo pull—en el que las GPU obtienen activamente los datos—en lugar de un modelo push, citando la alta sobrecarga de notificaciones en las operaciones push. Chan lo refuta, argumentando que en realidad el pull es más lento y que sería preferible mejorar las capacidades de los adaptadores de red. Sin embargo, ambos podrían estar hablando de capas diferentes del problema: el informe aborda la sobrecarga del mecanismo de notificación, mientras que Chan se refiere a la latencia de transmisión en sí.
Sobre las funciones de activación, el informe recomienda reemplazar SwiGLU por funciones más simples para reducir la carga computacional. Chan no ve mérito en ello, señalando que Sonic MoE ya ha demostrado un rendimiento óptimo usando SwiGLU. Chan sospecha que DeepSeek pudo haber “debilitado deliberadamente esta sección.”
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
El regulador suizo FINMA advierte que la herramienta de IA Mythos de Anthropic plantea riesgos financieros
Mensaje de Gate News, 24 de abril — la Autoridad de Supervisión de los Mercados Financieros de Suiza (FINMA) ha declarado que permitir que los bancos adopten rápida y cómodamente la herramienta de inteligencia artificial de Anthropic Mythos supondría riesgos graves para el
GateNewsHace2m
DeepSeek V4 以 1M 上下文窗口发布;华为 Ascend 与昆仑芯片实现完全兼容
Gate 新闻消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 已于 4月24日正式发布并开源;上下文处理长度从 128K 显著扩展至 1M,容量提升接近 10 倍。华为计算宣布其 Ascend 超级节点
GateNewsHace51m
Fere AI completa una ronda de financiación de $1.3M liderada por Ethereal Ventures
Mensaje de Gate News, 24 de abril — Fere AI, una plataforma de agentes de trading de activos digitales impulsada por IA, anunció la finalización de una ronda de financiación de $1.3 millones liderada por Ethereal Ventures, con la participación de Galaxy Vision Hill y Kosmos Ventures.
La plataforma admite redes entre cadenas, incluidas Ethereum,
GateNewshace1h
Anthropic revierte los cambios de Claude Code tras una caída de calidad; todas las correcciones están completas
Mensaje de Gate News, 24 de abril — Anthropic ha reconocido una reciente disminución en la calidad de Claude Code y ha confirmado que todos los problemas relacionados se han resuelto mediante retrocesos (rollbacks) y correcciones. Los problemas surgieron a partir de tres ajustes de producto y de prompts realizados entre principios y mediados de abril.
El 4 de marzo, el
GateNewshace2h
Cofundador de NeoSoul Kaelan: La industria de la IA debería permitir que existan juguetes; la innovación a menudo comienza como productos experimentales
Mensaje de Gate News, 24 de abril — En un reciente foro en Hong Kong sobre finanzas inteligentes cifradas, el cofundador de NeoSoul, Kaelan, compartió ideas para evaluar proyectos de IA en la etapa inicial, en una industria de IA que evoluciona rápidamente. Más allá de evaluar los productos actuales, los equipos deben demostrar la capacidad de mantenerse al ritmo con las capacidades del modelo subyacente, en un
GateNewshace3h
Meta desplegará decenas de millones de chips AWS Graviton5 en un acuerdo multimillonario plurianual
Mensaje de Gate News, 24 de abril — Meta ha firmado un acuerdo plurianual con Amazon Web Services para desplegar decenas de millones de procesadores Graviton5 para su infraestructura de IA, convirtiendo a Meta en uno de los mayores clientes globales de Graviton de AWS. El acuerdo, con una duración de entre tres y cinco años, tiene un valor de miles de millones de d
GateNewshace3h