Databricks称:顶级AI模型在日常企业任务中落后,更小的专业化模型表现更佳

Gate News消息,4月20日——根据Databricks的David Meyer表示,顶级AI模型在解决奥林匹克数学等复杂问题上表现出色,但在日常企业工作中却会遇到困难。有些模型可能会把错误的发票号码改正掉,而不是将其标记为错误;而像Claude这样的编码工具在数据工程任务上也可能表现不佳。

这一差距源于企业数据与用于训练大型模型的公开网页文本之间的根本差异。企业数据中常见模糊的列名、大量空字段,以及以纯文本形式存储的代码。在一项学术研究中,用于数据工程任务的AI模型,其F1分数(平衡精确率与召回率)从在公开数据上达到的0.94,降到了在企业数据上的0.07。此外,大型模型往往会默认使用训练中熟悉的模式;即使在收到关于公司专有查询语言的指令与文档后,仍有一些模型默认使用结构化查询语言 (SQL)。

经过强化学习调优的小型开源模型能够以更高效率处理特定工作,并且其训练成本显著低于大型通用模型。Databricks正在为特定工作流程构建更小的AI代理,例如KARL,它使用强化学习进行带公司文档的多步骤推理。行业正在从依赖巨型模型转向混合架构:由小而高效的模型处理日常海量任务,然后只在遇到不清楚或复杂的情况时才升级到更大、更昂贵的系统。

Databricks最近收购了Quotient AI,以帮助大型企业更可靠地运行AI代理。如今,AI业务的竞争焦点在于运行完整的AI生命周期,包括用于追踪错误的反馈系统,并随着时间持续改进模型;因此,评估与调优工具在部署之后变得愈发有价值。

news.article.disclaimer

btc.bar.articles

Fere AI เสร็จสิ้นการระดมทุน 1.3M ดอลลาร์ ที่นำโดย Ethereal Ventures

ข่าว Gate ประจำวัน 24 เมษายน — Fere AI ซึ่งเป็นแพลตฟอร์มเอเจนต์การเทรดสินทรัพย์ดิจิทัลที่ขับเคลื่อนด้วย AI ประกาศเสร็จสิ้นการระดมทุนมูลค่า 1.3 ล้านดอลลาร์ ซึ่งนำโดย Ethereal Ventures โดย Galaxy Vision Hill และ Kosmos Ventures เข้าร่วมด้วย แพลตฟอร์มรองรับเครือข่ายข้ามสายรวมถึง Ethereum,

GateNews2 ชั่วโมง ที่แล้ว

การเปิดตัว Major CEX Wallet ของ Agentic Wallet สำหรับ AI Agents พร้อมค่าธรรมเนียมเป็นศูนย์ในช่วงโปรโมชัน

ข้อความข่าว Gate วันที่ 24 เมษายน — กระเป๋าเงินของการแลกเปลี่ยนสกุลเงินดิจิทัลรายใหญ่ได้เปิดตัว AgenticWallet ซึ่งเป็นกระเป๋าเงินแบบไม่ใช้คีย์ (keyless) ที่ออกแบบมาเฉพาะสำหรับเอเจนต์ AI แพลตฟอร์มดังกล่าวช่วยให้ผู้ใช้สามารถอนุญาตให้เอเจนต์ AI ดำเนินการซื้อขาย การโอน และการจัดการสินทรัพย์ได้อย่างปลอดภัย ภายในพารามิเตอร์ที่กำหนด

GateNews4 ชั่วโมง ที่แล้ว

โครงสร้างพื้นฐาน Web3 AI AIW3 ระดมทุน Seed ได้ $2M ล้าน นำโดย Buffalo Capital

ข่าวจาก Gate วันที่ 24 เมษายน — แพลตฟอร์มโครงสร้างพื้นฐาน Web3 AI AIW3 ประกาศเสร็จสิ้นการระดมทุน Seed รอบแรกจำนวน $2 ล้านดอลลาร์แล้ว รอบนี้นำโดย Buffalo Capital โดย GalaXin Capital และ Three-stones Ventures เข้าร่วมในฐานะผู้ร่วมลงทุน AIW3 กำลังเปลี่ยนผ่านไปสู่กรอบแนวคิดการดำเนินการแบบ on-chain ของ Agent-as-a-Service

GateNews6 ชั่วโมง ที่แล้ว

รัฐบาลสหรัฐอาหรับเอมิเรตส์ประกาศนำใช้ AI agent โดยคาดว่าจะแล้วเสร็จภายในเร็วที่สุดในปี 2028 เพื่อให้งานอย่างน้อยครึ่งหนึ่งดำเนินการได้โดยอัตโนมัติ

สหรัฐอาหรับเอมิเรตส์ประกาศว่า ภายในสองปี จะให้หน่วยงานของรัฐบาลกลาง 50% หน่วยงาน บริการ และการดำเนินงานดำเนินการด้วยเอเจนต์ AI ที่เป็นอิสระ โดยเป็นกรณีแรกของโลก AI จะกลายเป็นพาร์ทเนอร์ในการดำเนินงานของรัฐบาล ช่วยสนับสนุนการตัดสินใจ ยกระดับการบริการ และปรับปรุงตัวเองให้ดีขึ้น ข้าราชการทุกคนต้องเข้ารับการฝึกอบรมภาคบังคับ โดยผลการปฏิบัติงานของรัฐมนตรีและประสิทธิผลของการนำ AI ไปใช้จะเชื่อมโยงกัน มีการผลักดันโดยคณะทำงานเฉพาะกิจที่ประธานาธิบดีเป็นผู้กำกับดูแล การดำเนินการนี้มาจากการสะสมเชิงนโยบายมากว่าสิบปีและยุทธศาสตร์ AI โดยแกนหลักคือยึดมนุษย์เป็นศูนย์กลาง

ChainNewsAbmedia8 ชั่วโมง ที่แล้ว

OristaPay เปิดตัวระบบชำระเงินที่ขับเคลื่อนด้วย AI บน Telegram ช่วยให้ชำระ USDT ได้ทันทีบน TON

ข่าวจาก Gate วันที่ 24 เมษายน — OristaPay ซึ่งเป็นแบรนด์ที่ดำเนินงานภายใต้ RD Technologies ได้ประกาศช่องทางการชำระเงินแบบครบวงจรที่ช่วยให้เอเจนต์ AI สามารถดำเนินการทำธุรกรรมภายในระบบนิเวศของ Telegram ในระหว่างงาน Hong Kong Web3 Festival ระบบนี้ช่วยให้ผู้ใช้เรียกใช้ธุรกรรมสินทรัพย์ดิจิทัลผ่านการโต้ตอบด้วยภาษาธรรมชาติ โดยไม่ต้องออกจากหน้าต่างแชท. ระหว่างการสาธิตแบบสด เอเจนต์ AI ที่ขับเคลื่อนโดย BytePlus ได้ประมวลผลคำขอบริการ ตีความเจตนาของผู้ใช้ และเริ่มการชำระเงินผ่านช่องทางของ OristaPay ธุรกรรมเสร็จสิ้นทันทีโดยใช้ USDT บนเครือข่ายบล็อกเชน TON โครงสร้างพื้นฐานของแพลตฟอร์มถูกสร้างขึ้นบนความสามารถทางการเงินหลัก 5 ด้าน ได้แก่ ลูกหนี้ เจ้าหนี้ เงินฝาก การโอนเงิน และการบริหารความมั่งคั่ง ซึ่งสร้างระบบนิเวศแบบครบวงจรที่เชื่อมโยงสินทรัพย์บนบล็อกเชนกับกรณีการใช้งานเชิงพาณิชย์. OristaPay มอบอินเทอร์เฟซที่เป็นมาตรฐานให้แก่ผู้พัฒนาเพื่อผสานฟังก์ชันการชำระเงินเข้ากับแอปพลิเคชัน AI ได้อย่างมีความซับซ้อนน้อยที่สุด แพลตฟอร์มดำเนินงานภายใต้กรอบกำกับดูแลของฮ่องกง ทำให้เหมาะสมเป็นโซลูชันที่ปลอดภัยสำหรับองค์กรที่กำลังเปลี่ยนผ่านไปสู่การพาณิชย์บน Web3 โครงการนี้มีเป้าหมายเพื่อแก้ไขข้อจำกัดของเกตเวย์การชำระเงินแบบดั้งเดิม ด้วยการผสานโมเดลภาษาขนาดใหญ่ โครงสร้างพื้นฐานของบล็อกเชน และแพลตฟอร์มโซเชียล ให้เป็นระบบการเงินแบบครบวงจรหนึ่งเดียว

GateNews10 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น