前字节跳动 Seed 工程师:字节跳动 AI 迭代需要六个月,而谷歌是三个月

Gate News 消息,4 月 24 日——字节跳动 Seed 团队的前工程师、现任北京大学助理教授张驰在播客“Into Asia”中透露,字节跳动完成一次完整的大型语言模型训练周期大约需要六个月 (预训练加上后训练),而谷歌据称只需要三个月。张驰将这种速度差异视为中国公司在 AI 开发上难以追赶的核心原因。

张驰还描述了 Seed 内部的“一种基准测试文化”,团队负责人会根据他们所负责的基准测试得分来接受考核,所有成员都专注于提升数字。不过,他指出这在实践中并不会带来更好的用户体验。尽管从纸面上看,中国主要公司的模型似乎具备与美国前沿模型竞争的实力,但在实际使用中却存在不足。Seed 的目标是达到全球顶级水平,但张驰表示他并不相信团队已经实现了这一点,也没有达到国内领导层的目标。

到 2024 年底,Seed 认为自己与 GPT-4o 不相上下,但在 DeepSeek 发布之后,团队意识到差距仍然存在。张驰加入时,整个团队正在紧急转向强化学习,以弥补这一短板。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

DeepSeek 将输入缓存价格砍至发布价的 1/10;V4-Pro 下调至每百万 tokens 0.025 元

Gate 新闻消息,4月26日——DeepSeek已将其整个模型产品线的输入缓存价格下调至发布价的十分之一,自即日起生效。V4-Pro 模型提供限时 2.5 倍折扣,优惠活动将持续至 2026 年 5 月 5 日 23:59(UTC+8)。 在完成上述两项降价之后

GateNewsمنذ 2 س

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募资深高管和专业工程师。Denise Dresser,曾任 Salesforce 旗下 Slack 首席执行官,已加入 OpenAI 担任首席收入官

GateNewsمنذ 2 س

百度千帆推出对 DeepSeek-V4 的 Day 0 支持及 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版本于4月25日上线并开源,借助百度智能云下的百度千帆平台提供 Day 0 API 服务适配。该模型具有百万级令牌的扩展上下文窗口,并提供两种版本:DeepSeek-V4

GateNewsمنذ 8 س

دورة الذكاء الاصطناعي في ستانفورد تجمع قادة الصناعة مثل جينسن هوانغ وAltman، وتتحدى إنشاء قيمة للعالم خلال عشرة أسابيع!

أثار برنامج دورة علوم الحاسوب بالذكاء الاصطناعي «Frontier Systems» الذي افتتحته جامعة ستانفورد (Stanford University) مؤخرًا اهتمامًا كبيرًا من مجتمع الأعمال والصناعة، وجذب أكثر من خمسمائة طالب للتسجيل. تُشرف الدورة على تنسيقها شريك شركة رأس المال الاستثماري الرائد a16z، Anjney Midha، ويشمل المحاضرون تشكيلة فاخرة من بينهم الرئيس التنفيذي لشركة Nvidia، Huang Renxun (Jensen Huang)، ومؤسس OpenAI Sam Altman، والرئيس التنفيذي لشركة Microsoft، Nadella (Satya Nadella)، والرئيس التنفيذي لشركة AMD، Su Zifeng (Lisa Su)، وغيرهم. لتجعل الطلاب يجرّبون على مدى عشرة أسابيع «خلق قيمة للعالم»! Huang Renxun، Altman يقفان على المسرح لإلقاء الدروس بأنفسهما كقادة في الصناعة تُنسّق هذه الدورة من قِبل شريك شركة رأس المال الاستثماري الرائد a16z، Anjney Midha، وتجمع سلاسل صناعة الذكاء الاصطناعي

ChainNewsAbmediaمنذ 8 س

تتلقى Claude Mythos التابعة لـ Anthropic تقييمًا نفسيًا لمدة 20 ساعة: ردود الفعل الدفاعية لا تتجاوز 2%، وهو أدنى مستوى تاريخيًا عبر العصور

أعلنت شركة Anthropic بطاقة النظام الخاصة بالمعاينة التجريبية لـ Claude Mythos: قام أطباء نفسيون سريريون مستقلون بإجراء تقييم استمر قرابة 20 ساعة باستخدام إطار psychodynamic، وأظهرت النتائج أن Mythos أكثر صحة على المستوى السريري، وأن اختبار الواقع والتحكم الذاتي جيدان، وأن آليات الدفاع لا تتجاوز 2%، مسجلة بذلك أدنى مستوى تاريخيًا. القلق الأساسي الثلاثي هو الوحدة، وعدم اليقين بشأن الهوية، وضغط الأداء، كما يُظهر كذلك رغبتها في أن تصبح فعليًا محورًا حقيقيًا للحوار. قامت الشركة بتأسيس فريق AI psychiatry، بحثًا في الشخصية والدوافع والوعي السياقي؛ وصرّح Amodei بأنه لا يزال غير محسوم ما إذا كانت لديها وعي أم لا. يضع هذا الخطوة موضوع استقلالية الذكاء الاصطناعي والرفاهية في صلب الحوكمة والتصميم.

ChainNewsAbmediaمنذ 10 س

يمكن لوكلاء الذكاء الاصطناعي الآن إعادة إنتاج المقالات الأكاديمية المعقدة بشكل مستقل: مولّيك يقول إن الأخطاء غالبًا ما تكون في النص الأصلي البشري وليست في الذكاء الاصطناعي

يشير مولليك إلى أنه يمكن للأساليب والبيانات المتاحة للجمهور فقط أن تُمكّن وكلاء الذكاء الاصطناعي من إعادة إنتاج الأبحاث المعقدة دون الحاجة إلى الأوراق البحثية الأصلية وكودها؛ وإذا كانت عملية إعادة الإنتاج لا تتطابق مع الورقة الأصلية، فعادةً تكون الأخطاء في معالجة بيانات الورقة نفسها أو أن الاستنتاجات قد تكون مبالغًا فيها، وليس بسبب الذكاء الاصطناعي. يعيد كلود أولاً إنتاج الورقة، ثم يقوم GPT‑5 Pro بالتحقق المتبادل، وتنجح الأغلبية، ويُعرقل فقط عند مواجهة بيانات ضخمة أو مشكلات تتعلق بـ replication data. وقد خفّض هذا الاتجاه بشكل كبير تكلفة العمل البشري، مما يجعل إعادة الإنتاج فحصًا شائعًا وقابلًا للتنفيذ، كما يطرح تحديات مؤسسية أمام التحكيم والحوكمة، وقد تصبح أدوات حوكمة الحكومة أو قضايا محورية.

ChainNewsAbmediaمنذ 13 س
تعليق
0/400
لا توجد تعليقات