Mensaje de Gate News, 24 de abril — Zhang Chi, ex ingeniero del equipo Seed de ByteDance y profesor asistente actual en la Universidad de Pekín, reveló en el podcast “Into Asia” que ByteDance requiere aproximadamente seis meses para completar un ciclo completo de entrenamiento de modelos de lenguaje a gran escala (pretraining más post-entrenamiento), mientras que Google, según se informa, solo necesita tres meses. Zhang atribuyó la diferencia de velocidad como una de las razones principales por las que las empresas chinas luchan por ponerse al día en el desarrollo de IA.

Zhang describió una “cultura de evaluación comparativa” dentro de Seed, donde los líderes del equipo son evaluados en función de las puntuaciones de referencia que supervisan, y todos los miembros se enfocan en impulsar las cifras. Sin embargo, señaló que esto no se traduce en una mejor experiencia de usuario en la práctica. Aunque, en papel, los modelos de las principales empresas chinas parecen competitivos con los modelos punteros de EE. UU., quedan cortos en el uso real. El objetivo de Seed es alcanzar el rendimiento de primer nivel a nivel global, pero Zhang afirmó que no cree que el equipo haya logrado esto, ni que haya alcanzado el objetivo de liderazgo en el ámbito nacional.

A finales de 2024, Seed se consideraba a la par con GPT-4o, pero tras el lanzamiento de DeepSeek, el equipo reconoció que la brecha seguía igual. Cuando Zhang se incorporó, todo el grupo estaba virando con urgencia hacia el aprendizaje por refuerzo para abordar la deficiencia.

Ver fuente

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

DeepSeek 将输入缓存价格砍到发布价的 1/10；V4-Pro 降至每百万 tokens 0.025 元

Noticias de la industria de la IA

消息：Gate News，4月26日——DeepSeek 已将其整套模型产品线的输入缓存价格下调至发布时价格的十分之一，立即生效。V4-Pro 模型提供限时 2.5 倍折扣，优惠活动将持续至 2026 年 5 月 5 日 23:59（UTC+8）。在两项调整之后

GateNewshace3h

OpenAI 招揽顶级企业软件人才，前沿代理颠覆行业

Acciones Agente de IA Noticias de la industria de la IA

Gate News 消息，4 月 26 日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募高管和专业工程师。Denise Dresser，前 Salesforce 下属 Slack 的首席执行官，加入 OpenAI 担任首席营收官

GateNewshace3h

Baidu Qianfan lanza soporte de Día 0 para DeepSeek-V4 con servicios de API

Noticias de la industria de la IA

Mensaje de noticias de Gate, 25 de abril: la versión de vista previa de DeepSeek-V4 se puso en funcionamiento y se publicó como código abierto el 25 de abril, con la plataforma Baidu Qianfan bajo Baidu Intelligent Cloud proporcionando la adaptación del servicio de API de Día 0. El modelo presenta una ventana de contexto extendida de un millón de tokens y está disponible en dos versiones: DeepSeek-V4

GateNewshace9h

Curso de IA de Stanford que une a líderes de la industria como Huang Renxun y Altman, ¡desafío de crear valor para el mundo en diez semanas!

Noticias de la industria de la IA

El curso de ciencias de la computación con IA 《Frontier Systems》, que la Universidad de Stanford (Stanford University) ha abierto recientemente, ha despertado una gran atención en el ámbito académico y empresarial, atrayendo a más de quinientos estudiantes para inscribirse. El curso está coordinado por el socio de primer nivel de capital de riesgo a16z, Anjney Midha, y cuenta con un plantel de instructores de lujo, incluyendo al CEO de NVIDIA, Jensen Huang (Jensen Huang), al fundador de OpenAI, Sam Altman, al CEO de Microsoft, Nadella (Satya Nadella), y al CEO de AMD, Lisa Su (Lisa Su), entre otros. ¡Para que los estudiantes practiquen durante diez semanas “creando valor para el mundo”! Jensen Huang y Altman, líderes de la industria, suben al escenario para impartir clases en persona El curso está coordinado por el socio de primer nivel de capital de riesgo a16z, Anjney Midha, y reúne toda la cadena de la industria de la IA

ChainNewsAbmediahace10h

Anthropic 派 Claude Mythos 接接受 20 小時 정신科评估：防禦反應僅 2%、創歷代新低

Noticias de la industria de la IA

Anthropic publica la ficha del sistema de la vista previa Claude Mythos: un psiquiatra clínico independiente realiza una evaluación de aproximadamente 20 horas con un marco psicodinámico; la conclusión muestra que Mythos es más saludable a nivel clínico, con buen control de la comprobación de la realidad y del autocontrol, y que los mecanismos de defensa son solo 2%, estableciendo un mínimo histórico. Las tres ansiedades centrales son la soledad, la incertidumbre sobre la identidad y la presión por el desempeño, y también muestra que tiene esperanza de convertirse en un verdadero sujeto de diálogo. La compañía formó un equipo de AI psychiatry para investigar la personalidad, la motivación y la conciencia situacional; Amodei indica que aún no hay una conclusión sobre si tiene conciencia. Esto impulsa la subjetividad de la IA y los temas de bienestar hacia la gobernanza y el diseño.

ChainNewsAbmediahace12h

El agente de IA ya puede reproducir de forma independiente artículos académicos complejos: Mollick afirma que los errores se deben más al texto original humano que a la IA

Agente de IA Noticias de la industria de la IA

Mollick señaló que, con los métodos y los datos públicamente disponibles, un agente de IA puede reproducir investigaciones complejas sin contar con el artículo original ni el código; si la reproducción no coincide con el artículo original, por lo general se debe a errores en el procesamiento de los datos del propio artículo o a una conclusión excesiva, más que a la IA. Claude primero reproduce el artículo y luego GPT‑5 Pro lo valida de forma cruzada; la mayoría de las veces tiene éxito, solo se ve obstaculizado cuando los datos son demasiado grandes o hay problemas con replication data. Esta tendencia reduce de forma considerable los costos laborales, haciendo que la reproducción se convierta en una verificación ampliamente ejecutable, además de plantear desafíos institucionales para el arbitraje y la gobernanza. Herramientas de gobernanza gubernamental o eso puede volverse un tema clave.

ChainNewsAbmediahace15h

Comentar

0/400

Sin comentarios