Gate News 消息,4月27日——Google DeepMind 高级产品经理、Google AI Studio 产品负责人 Logan Kilpatrick 在 X 上表示,所有构建基于 AI 的产品的公司都应建立各自的定制基准,以衡量 AI 模型的性能。他将其描述为一种方法,用于让模型改进“对贵公司产生不成比例的收益”,并敦促创始人和商业领袖“从明天开始。”
目前,大多数公司依赖公开排行榜来选择 AI 模型,但这些榜单衡量的是通用能力,往往与特定业务场景不匹配。Kilpatrick 举例称,一家合同审查公司最关心的是条款提取的准确性——而这项能力在公开基准中缺失,导致无法评估模型在该任务上的表现。定制基准具有两项关键优势:首先,它们使公司能够针对自身业务任务评估每一次模型更新,并选择在实际使用场景中表现最佳的模型,而不是选择总体排名最高的模型;其次,它们允许公司将这些测试集与模型提供方共享,从而在与业务相关的领域推动持续优化。
Kilpatrick 指出,像 Zapier 和 Sierra 这样的公司已经在采用这种做法,并表示“这里可以创造出大量的 α(超额收益/优势)。”
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
OpenAI 的 Greg Brockman:AI 正从聊天转向自主执行任务
Gate News 消息,4 月 27 日——OpenAI 联合创始人兼总裁 Greg Brockman 表示,新一轮人工智能将把用户从与 AI 机器人聊天转向分配现实世界的任务。此转变要求企业重新思考运营工作流,并为安全、管理和成本建立新的协议。
GateNewsمنذ 1 د
B.AI 升级基础设施,推出主要 Skills 功能
Gate 新闻消息,4月27日——B.AI 本周宣布了多项产品与生态进展。BAIclaw 登陆页面获得了全面的视觉与交互改版,并将网站多语言支持扩展至 10 种语言,从而强化其全球可用性。
在基础设施方面
GateNewsمنذ 15 د
بكين تلزم بإلغاء حظر التداول! فشل صفقة ميتا للاستحواذ على شركة ناشئة في مجال الذكاء الاصطناعي في الصين بقيمة 2 مليار دولار أمريكي (20 مليون دولار).
نشرت اليوم لجنة التنمية والإصلاح الوطنية التابعة ل الصين إعلانًا رسميًا في 27 (نيسان/أبريل) ، (4) ، مكتب آلية مراجعة سلامة استثمارات الأجانب «اتخذ قرارًا بمنع الاستثمار في عملية شراء مشروع Manus من طرف المستثمرين الأجانب وفقًا للقانون واللوائح، وطلب من الأطراف المعنية إلغاء معاملة الشراء هذه». وهذه هي من بين الحالات القليلة التي تم فيها، منذ تطبيق «إجراءات مراجعة سلامة استثمارات الأجانب» في الصين، اللجوء إلى أعلى مستوى من «المنع من الاستثمار» والمطالبة بإلغاء المعاملة القائمة.
قامت Meta بضخ 2.0 مليار دولار أمريكي، واشترت أرخص تطبيقات الذكاء الاصطناعي
أعدنا الزمن إلى 29 ديسمبر 2025. أعلنت Meta الاستحواذ على شركة ناشئة صينية في مجال وكلاء الذكاء الاصطناعي تدعى Manus، وقد توقّعت السوق أن يقع السعر بين 20 إلى 30 مليار دولار أمريكي. Manus هو ذكاء اصطناعي عام طوّرته شركة «بكين ذيلت إفكت للتكنولوجيا»، وبعد إطلاقه في 6 مارس 2025، لفت أنظارًا في ليلة واحدة بسبب الأداء المتميز في معيار GAIA
ChainNewsAbmediaمنذ 29 د
Xizhi Technology-P IPO前灰市股价飙升超360%,涨幅收窄至320%
Gate News消息,4月27日——(01879.HK),一家香港上市的AI芯片公司Xizhi Technology-P,其股价在今天早些时候的灰色市场(暗市)上飙升超过360%,尽管此后涨幅已收窄至320%。
该股票正在其官方香港IPO上市之前进行交易
GateNewsمنذ 42 د
هل سيؤدي استخدام الذكاء الاصطناعي إلى زيادة الإنتاجية أم خفض التكاليف؟ لم تتحول الكفاءة بمئة ضعف إلى إيرادات بمئة ضعف، لكن لا أحد في وادي السيليكون يجرؤ على إيقاف ذلك
شركة Wuyuan Capital، الشريك الشريك مينغ شينغ، مؤخراً نشر تقريراً عن زيارته إلى وادي السيليكون، وقدّم حكماً جعله هو نفسه يغيّر عادات تدوين الملاحظات: وادي السيليكون دخل الآن مرحلة لا ينجو فيها حتى مَن يقدر على ركوب الأمواج من أن تجرفه الأمواج. لقد انتقل معدل تطوّر الذكاء الاصطناعي من «شهرياً» إلى «أسبوعياً»، حتى أن وادي السيليكون نفسه لم يعد يواكب نفسه.
عندما يُضخِّم الذكاء الاصطناعي إنتاجية فريق بمقدار خمس مرات، يمكنك تقليل ثمانين بالمئة من الموارد البشرية للحفاظ على الناتج السابق، أو إبقاء عدد الموظفين كما هو والقيام بما يعادل خمس مرات. تُعَد ملاحظة مينغ شينغ هذه في وادي السيليكون، كأنها في الموقع قدّمت مسودة أولى للإجابة: عندما لا يتحوّل معدل كفاءة 100 ضعف إلى إيرادات 100 ضعف، عندما تقترب ميزانية الـ token من تكاليف العمالة، وعندما لا يزال المحرّك البخاري لا يستطيع اللحاق بالعربة التي تجرّها الخيول بينما لا أحد يجرؤ على التوقف، فإن وادي السيليكون اختار الآن «رفع السرعة أولاً ثم الكلام». لكن في نهاية هذا الطريق، هل سيتجه نحو «قدرة التوسّع» أم «خفض التكاليف»، لا يزال لا توجد خلاصة حاسمة.
تحوّل YC من مؤشرات رائدة إلى مؤشرات متأخرة
مينغ شينغ هذا العام
ChainNewsAbmediaمنذ 1 س