Mensaje de Gate News, 27 de abril — Logan Kilpatrick, gerente de producto senior en Google DeepMind y responsable de producto de Google AI Studio, afirmó en X que cada empresa que construye productos basados en IA debe establecer sus propios puntos de referencia personalizados para medir el rendimiento de los modelos de IA. Lo describió como una forma para que las mejoras del modelo “beneficien de manera desproporcionada a tu empresa” y exhortó a los fundadores y líderes empresariales a “empezar mañana.”

La mayoría de las empresas actualmente dependen de rankings públicos para seleccionar modelos de IA, pero estos miden capacidades generales que a menudo no se alinean con escenarios empresariales específicos. Kilpatrick citó el ejemplo de una empresa de revisión de contratos que se centra principalmente en la precisión de la extracción de cláusulas, una capacidad ausente en los puntos de referencia públicos, lo que hace imposible evaluar el rendimiento del modelo en esa tarea. Los puntos de referencia personalizados ofrecen dos ventajas clave: primero, permiten a las empresas evaluar cada actualización de modelo frente a sus propias tareas de negocio y seleccionar el modelo que mejor se desempeña en su caso de uso real en lugar del modelo mejor clasificado en general; segundo, permiten a las empresas compartir estos conjuntos de prueba con los proveedores de modelos, impulsando la optimización continua en las áreas que importan para su negocio.

Kilpatrick señaló que empresas como Zapier y Sierra ya están implementando este enfoque, afirmando que “aquí se puede crear mucho alpha”.

Ver fuente

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Greg Brockman de OpenAI: la IA cambia del chat a la ejecución autónoma de tareas

Agente de IA Noticias de la industria de la IA

Mensaje de Gate News, 27 de abril — Greg Brockman, presidente y cofundador de OpenAI, dice que la siguiente ola de inteligencia artificial trasladará a los usuarios de chatear con bots de IA a asignar tareas del mundo real. Este cambio exige que las empresas replanteen los flujos de trabajo operativos y establezcan nuevos protocolos para la seguridad, la gestión y los costos. Brockman sostiene que la IA debe ir más allá de las interfaces de chat independientes e integrarse directamente en el software corporativo existente para resolver problemas de forma autónoma. Los modelos recientes han superado un umbral de utilidad, mejorando en la creación de presentaciones, hojas de cálculo y tareas basadas en el navegador con instrucciones mínimas. Sin embargo, otorgar a la IA esta libertad operativa introduce nuevos riesgos: los errores podrían escalar desde el envío de correos electrónicos incorrectos hasta modificaciones no autorizadas en bases de datos. Para gestionarlo, Brockman explica que los empleados pasarán de ejecutar tareas a supervisar flotas de agentes de IA, manteniéndose responsables mientras delegan los detalles operativos. El desafío de la integración también se extiende a cómo los usuarios interactúan con sistemas de IA. Los modelos se están volviendo más intuitivos, infiriendo de forma activa los objetivos del usuario a partir del contexto en lugar de exigir instrucciones paso a paso. Brockman subraya que el foso competitivo no está en modelos individuales de IA, sino en el propio sistema integrado: comparable con construir un automóvil donde un motor superior aporta poco si el resto del vehículo no tiene calidad. OpenAI está invirtiendo en infraestructura interna y herramientas para desarrolladores para mantener esta ventaja. La capacidad de cómputo y los costos representan otra restricción crítica. A medida que los agentes autónomos se escalan, exigen recursos sustanciales de servidor, generando tensión entre la caída de los costos de cómputo y el aumento de la demanda. Brockman señala que OpenAI ha reducido precios año tras año mientras mantiene márgenes positivos, pero advierte sobre un próximo "mundo de escasez de cómputo" a medida que el uso intensivo de agentes se acerque a los límites de tasa. La supervisión a nivel empresarial también es igual de vital; los departamentos de TI deben mantener visibilidad total de todos los agentes de IA desplegados dentro de las organizaciones, gestionando la seguridad, la seguridad (safety) y la observabilidad en cientos de miles de despliegues. Compensando estas perspectivas optimistas, Gartner predijo en junio de 2025 que más del 40% de los proyectos de IA agentica se descartarán para finales de 2027 debido al aumento de costos y al valor empresarial poco claro, y que solo el 15% de las decisiones de trabajo diario se espera que se tomen de forma autónoma para 2028. Además, los precios de modelos de IA ajustados por calidad han caído un 80% en los últimos dos años a medida que surgieron modelos más pequeños y eficientes y se intensificó la competencia, lo que sugiere que la integración de flujos de trabajo y la gobernanza podrían volverse más defendibles que, por sí sola, la capacidad bruta del modelo.

GateNewsHace1m

B.AI Actualiza la Infraestructura y Lanza Funciones Principales de Habilidades

Avance del proyecto Asociaciones y ecosistema Agente de IA Noticias de la industria de la IA

Mensaje de Gate News, 27 de abril — B.AI anunció múltiples avances de producto y de ecosistema esta semana. La página de aterrizaje de BAIclaw recibió una revisión completa del diseño visual y de la interacción, con el soporte multilingüe del sitio web ampliado a 10 idiomas, fortaleciendo su usabilidad global. En el frente de la infraestructura

GateNewsHace15m

Pekín ordena retirar la prohibición de comercio: Meta pierde la adquisición de 2.000 millones de dólares para comprar a la startup china de IA Manus

Noticias de la industria de la IA

La Comisión Nacional de Desarrollo y Reforma de China ha publicado hoy (27 de abril) oficialmente un anuncio. La oficina del mecanismo de revisión de la seguridad de las inversiones extranjeras ha decidido, conforme a la ley y a las normas, “emitir una decisión de prohibición de inversión” sobre la adquisición por parte de inversores extranjeros del proyecto Manus, y ha ordenado a la parte interesada que cancele dicha operación de adquisición. Este es, desde la entrada en vigor de las “Medidas para la revisión de la seguridad de las inversiones extranjeras” de China, uno de los pocos casos en los que se ha aplicado el nivel más alto de control para gestionar “la prohibición de inversión” y exigir la anulación de una transacción ya realizada. Meta invierte 2.000 millones de dólares, compra la aplicación de IA más barata Volvamos al 29 de diciembre de 2025. Meta anunció la adquisición de una nueva empresa china de agentes de IA, Manus. El mercado estima que el precio se sitúa entre 2.000 y 3.000 millones de dólares. Manus es una IA general desarrollada por Beijing Butterfly Effect Technology Development. Tras su lanzamiento el 6 de marzo de 2025, destacó en el benchmark GAIA, y en una sola noche

ChainNewsAbmediaHace29m

Las acciones de la IPO de Xizhi Technology-P se disparan más de 360% en el mercado gris; las ganancias se reducen a 320%

Acciones Noticias de la industria de la IA

Mensaje de Gate News, 27 de abril — Xizhi Technology-P (01879.HK), una empresa de chips de IA cotizada en Hong Kong, vio cómo sus acciones se disparaban más de 360% en el mercado gris (dark market) más temprano hoy, aunque las ganancias desde entonces se han reducido a 320%. La acción cotiza antes de su listado oficial de IPO en Hong Kong

GateNewsHace41m

¿Mejora la producción o reduce los costos con la IA? No se obtiene una ganancia de ingresos al por mayor por una eficiencia cien veces mayor, pero en Silicon Valley nadie se atreve a decir que se detenga

Noticias de la industria de la IA

Los socios de Five Origins Capital, Meng Xing, recientemente publicó un informe de su visita e inspección a Silicon Valley y planteó una conclusión que incluso lo llevó a cambiar su hábito de tomar notas: Silicon Valley está entrando en una etapa en la que incluso las personas que saben “crear olas” terminan siendo arrastradas por las olas. La velocidad de iteración de la IA ya pasó de “mensual” a “semanal”, e incluso en Silicon Valley ya no pueden seguirles el ritmo a sí mismos. Cuando la IA amplifica la productividad de un equipo cinco veces, puedes reducir hasta el 80% del personal para mantener la producción original, o mantener el número de personas para hacer cinco veces más. La observación de Meng Xing en esta ocasión en Silicon Valley equivale a una primera versión de la respuesta dada en el lugar: cuando una eficiencia de 100 veces no se traduce en 100 veces de ingresos, cuando el presupuesto de tokens se acerca al costo laboral, cuando la máquina de vapor todavía no puede superar al carruaje pero nadie se atreve a detenerse, Silicon Valley ahora está eligiendo “primero acelerar la velocidad y ya veremos”. Pero al final este camino llegará a “capacidad de expansión” o a “compresión de costos”; por el momento, no hay una conclusión. YC pasó de indicadores líderes a indicadores rezagados Meng Xing este año

ChainNewsAbmediahace1h

Comentar

0/400

Sin comentarios