Databricks称:顶级AI模型在日常企业任务中落后 更小的专业化模型表现更好

Gate News消息,4月20日——根据Databricks的David Meyer所述,顶级AI模型擅长解决奥林匹克数学等复杂问题,但在处理日常企业工作时却会遇到困难。某些模型可能会改正错误的发票号码,而不是将其标记为错误;同时,像Claude这样的编码工具在数据工程任务上也可能表现不佳。

这种差距源于企业数据与用于训练大模型的公开网页文本之间存在根本性差异。企业数据往往包含含糊的字段标签、大量空白字段,以及以纯文本形式存储的代码。在一项学术研究中,用于数据工程任务的AI模型的F1分数(在精确率与召回率之间取得平衡)从公共数据上的0.94降至企业数据上的0.07。此外,大模型通常会默认套用训练中熟悉的模式;即便在收到针对某家公司专有查询语言的指令和文档之后,有些模型仍然默认使用结构化查询语言 (SQL)。

经过强化学习微调的小型开源模型可以以更高效率、显著更低的训练成本来处理特定工作,而大型通用模型则难以做到这一点。Databricks正在为特定工作流构建更小的AI代理,例如KARL,它使用强化学习来借助公司文档进行多步骤推理。行业正从依赖超大型模型转向混合架构:由小型高效模型负责处理日常的海量任务,然后仅在遇到不明确或复杂的情况时才升级到更大、更昂贵的系统。

Databricks最近收购了Quotient AI,以帮助大型企业更可靠地运行AI代理。AI业务中的竞争如今聚焦于运行完整的AI生命周期,包括用于追踪错误的反馈系统,并随着时间持续改进模型;因此,在部署之后,评估与调优工具的价值也变得愈发重要。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Fere AI تكمل جولة تمويل بقيمة 1.3 مليون دولار بقيادة Ethereal Ventures

بوابة الأخبار، 24 أبريل — أعلنت شركة Fere AI، وهي منصة لوكلاء تداول للأصول الرقمية مدعومة بالذكاء الاصطناعي، عن إتمام جولة تمويل بقيمة 1.3 مليون دولار بقيادة Ethereal Ventures، بمشاركة Galaxy Vision Hill وKosmos Ventures. تدعم المنصة شبكات عبر السلاسل بما في ذلك Ethereum,

GateNewsمنذ 10 س

إطلاق محفظة CEX رئيسية لـ Agentic Wallet لوكلاء الذكاء الاصطناعي مع رسوم صفرية خلال الفترة الترويجية

خبر بوابة، 24 أبريل — أطلقت محفظة تابعة لبورصة كبرى للعملات المشفرة AgenticWallet، وهي محفظة متخصصة بدون مفاتيح (Keyless) مخصصة لوكلاء الذكاء الاصطناعي. تتيح المنصة للمستخدمين تفويض وكلاء الذكاء الاصطناعي لتنفيذ عمليات التداول والتحويل وإدارة الأصول بشكل آمن ضمن المعلمات التي تم تكوينها

GateNewsمنذ 11 س

بنية Web3 للذكاء الاصطناعي AIW3 ترفع $2M في تمويل بذري بقيادة Buffalo Capital

خبر بوابة، 24 أبريل — أعلنت منصة بنية Web3 للذكاء الاصطناعي AIW3 عن إتمام جولة تمويل بذري بقيمة $2 مليون. قاد الجولة Buffalo Capital، مع مشاركة GalaXin Capital وThree-stones Ventures كمستثمرين مشاركين. تنتقل AIW3 نحو نموذج تنفيذ على السلسلة Agent-as-a-Service AaaS، مع توفير خدمات استراتيجيات قابلة للاستدعاء، وتنسيق وكلاء مستقلين، وتدفقات رأسمالية أصلية منسقة عبر المحافظ. يهدف المشروع إلى بناء طبقة تنفيذ على السلسلة على مستوى النظام من الجيل التالي. ذكرَت الشركة أن البنية الأساسية لبروتوكولها قد دخلت رسميًا مرحلة تشغيلية آنية قابلة للتحقق بالكامل، لتضع الأساس لتطوير طويل الأجل لشبكة وكلاء لامركزية قابلة للتوسع وبيئتها.

GateNewsمنذ 14 س

أعلنت الحكومة الإماراتية إدخال وكلاء بالذكاء الاصطناعي، على أن يتم إكمال تشغيل أتمتة نصف الأعمال في أسرع وقت بحلول 2028

أعلنت الإمارات العربية المتحدة أنه خلال عامين، ستُشغِّل وكلاء ذكاء اصطناعي مستقلة 50% من أقسام الحكومة الاتحادية والخدمات والعمليات، لتصبح أول حالة عالميًا من نوعها. وسيصبح الذكاء الاصطناعي شريكًا تنفيذيًا للحكومة، يساعد في اتخاذ القرار، ويحسن الخدمات، ويمكّن من التحسين الذاتي. وسيخضع جميع موظفي الخدمة المدنية لتدريب إلزامي، وربط أداء الوزراء بنتائج إدخال الذكاء الاصطناعي، عبر فريق عمل متخصص يُدفع تحت إشراف الرئيس. وتستند هذه الخطوة إلى تراكم سياسات لأكثر من عشر سنوات واستراتيجية للذكاء الاصطناعي، ويكمن جوهرها في نهج قائم على الإنسان.

ChainNewsAbmediaمنذ 15 س

OristaPay 在 Telegram 上推出 AI 驱动的支付系统,可实现 TON 上的即时 USDT 结算

Gate News 信息,4 月 24 日 — OristaPay,一家在 RD Technologies 旗下运营的品牌,宣布了一条完整的支付路径,使 AI 代理能够在香港 Web3 文化节期间于 Telegram 生态中执行交易。该系统允许用户通过自然语言交互发起数字资产交易,而无需离开聊天界面。通过

GateNewsمنذ 17 س
تعليق
0/400
لا توجد تعليقات