前字节跳动 Seed 工程师:字节跳动 AI 迭代需要六个月,而谷歌是三个月

Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客“Into Asia”中透露,字节跳动完成一次完整的大型语言模型训练周期大约需要六个月 (预训练加上后训练),而谷歌据称只需要三个月。张驰将这种速度差异视为中国公司在 AI 开发上难以追赶的核心原因。

张驰还描述了 Seed 内部的“一种基准测试文化”,团队负责人会根据他们所负责的基准测试得分来接受考核,所有成员都专注于提升数字。不过,他指出这在实践中并不会带来更好的用户体验。尽管从纸面上看,中国主要公司的模型似乎具备与美国前沿模型竞争的实力,但在实际使用中却存在不足。Seed 的目标是达到全球顶级水平,但张驰表示他并不相信团队已经实现了这一点,也没有达到国内领导层的目标。

到 2024 年底,Seed 认为自己与 GPT-4o 不相上下,但在 DeepSeek 发布之后,团队意识到差距仍然存在。张驰加入时,整个团队正在紧急转向强化学习,以弥补这一短板。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Sam Altman 概述 OpenAI 的五条运营原则,暗示可能因安全而对模型能力访问实施未来限制

Gate News 消息,4月27日——OpenAI 首席执行官 Sam Altman 以其个人签名发布了公司五条运营原则,表明 OpenAI 可能会在某些时期限制用户对模型能力的访问,以优先考虑安全。在声明中,Altman 描述了一个潜在的未来情景:公司可能需要为了更强的韧性而"牺牲部分赋能。"

GateNewsمنذ 14 د

DeepSeek يؤخر إطلاق V4 لتحسينه لأشباه Ascend من هواوي

بوابة الأخبار رسالة، 27 أبريل — تم تأجيل إصدار نموذج V4 من DeepSeek من أجل تحسين مكدس برمجياته لشيبس Ascend من هواوي، بما يعكس مبادرة بكين الأوسع لتطوير سلسلة توريد محلية للذكاء الاصطناعي مع تزايد تقييد الوصول إلى أشباه الموصلات الأجنبية المتقدمة. DeepSe

GateNewsمنذ 1 س

DeepSeek 将输入缓存价格砍至发布价的 1/10;V4-Pro 下调至每百万 tokens 0.025 元

Gate 新闻消息,4月26日——DeepSeek已将其整个模型产品线的输入缓存价格下调至发布价的十分之一,自即日起生效。V4-Pro 模型提供限时 2.5 倍折扣,优惠活动将持续至 2026 年 5 月 5 日 23:59(UTC+8)。 在完成上述两项降价之后

GateNewsمنذ 10 س

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募资深高管和专业工程师。Denise Dresser,曾任 Salesforce 旗下 Slack 首席执行官,已加入 OpenAI 担任首席收入官

GateNewsمنذ 10 س

百度千帆推出对 DeepSeek-V4 的 Day 0 支持及 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版本于4月25日上线并开源,借助百度智能云下的百度千帆平台提供 Day 0 API 服务适配。该模型具有百万级令牌的扩展上下文窗口,并提供两种版本:DeepSeek-V4

GateNewsمنذ 16 س

دورة الذكاء الاصطناعي في ستانفورد تجمع قادة الصناعة مثل جينسن هوانغ وAltman، وتتحدى إنشاء قيمة للعالم خلال عشرة أسابيع!

أثار برنامج دورة علوم الحاسوب بالذكاء الاصطناعي «Frontier Systems» الذي افتتحته جامعة ستانفورد (Stanford University) مؤخرًا اهتمامًا كبيرًا من مجتمع الأعمال والصناعة، وجذب أكثر من خمسمائة طالب للتسجيل. تُشرف الدورة على تنسيقها شريك شركة رأس المال الاستثماري الرائد a16z، Anjney Midha، ويشمل المحاضرون تشكيلة فاخرة من بينهم الرئيس التنفيذي لشركة Nvidia، Huang Renxun (Jensen Huang)، ومؤسس OpenAI Sam Altman، والرئيس التنفيذي لشركة Microsoft، Nadella (Satya Nadella)، والرئيس التنفيذي لشركة AMD، Su Zifeng (Lisa Su)، وغيرهم. لتجعل الطلاب يجرّبون على مدى عشرة أسابيع «خلق قيمة للعالم»! Huang Renxun، Altman يقفان على المسرح لإلقاء الدروس بأنفسهما كقادة في الصناعة تُنسّق هذه الدورة من قِبل شريك شركة رأس المال الاستثماري الرائد a16z، Anjney Midha، وتجمع سلاسل صناعة الذكاء الاصطناعي

ChainNewsAbmediaمنذ 17 س
تعليق
0/400
لا توجد تعليقات