تُصدر NVIDIA وMIT إطار Lightning OPD، ما يعزز كفاءة تقطير النماذج 4 مرات مع القضاء على مشكلات ذاكرة وحدة معالجة الرسوميات

وبحسب تقارير، أطلق باحثون من NVIDIA ومعهد ماساتشوستس للتكنولوجيا Lightning OPD (Offline On-Policy Distillation)، وهو إطار عمل جديد لما بعد التدريب لنماذج اللغات الكبيرة يُلغي الحاجة إلى إبقاء نموذج المعلم قيد التشغيل أثناء التدريب. ومن خلال المعالجة المسبقة لاحتمالات السجل الخاصة بنموذج المعلم دون اتصال بالإنترنت، يعزز الإطار كفاءة التدريب بمقدار 4 أضعاف، مع تحرير جميع موارد وحدات معالجة الرسومات للتدريب على نموذج الطالب.

وبالاختبار على 8 وحدات NVIDIA H100 GPU، نجح Lightning OPD في تقطير Qwen3-30B-A3B-Base (وهو نموذج MoE تبلغ معلماته 30 ملياراً) وحقق 71.0 في معيار AIME 2024، في حين تعذر على OPD القياسي العمل بسبب نفاد الذاكرة على الأجهزة نفسها. وبالنسبة لنموذج Qwen3-8B الأصغر، تطلب الإطار 30 ساعة GPU فقط للوصول إلى 69.9 نقطة.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

مقابلة خاصة مع إريك ترامب في منطقة بونّي على سلسلة كتل: يتحدث عن الذكاء الاصطناعي والطاقة في الولايات المتحدة، وبيتكوين، ويكشف أن ترامب لا يزال يناديه سراً بـ "honey"

ينح ثريزون/منشئ المحتوى في مجال البلوك تشين في تايوان يوتيوبر «邦尼區塊鏈» أجرى مؤخراً مقابلة مع Eric Trump، ليتناول حواراً حول شركة تعدين البيتكوين الأمريكية American Bitcoin، وسياسات الحكومة الأمريكية الخاصة بالعملات المشفرة في عهد ترامب، وقدرة الولايات المتحدة على منافسة الذكاء الاصطناعي والطاقة، إضافة إلى الأسباب التي دفعت Eric Trump شخصياً إلى دخول قطاع الأصول الرقمية. ابن ترامب: يجب أن تتفوق الولايات المتحدة في مجالات الطاقة والذكاء الاصطناعي والعملات المشفرة أكد Eric Trump في المقابلة مراراً أ

ChainNewsAbmediaمنذ 52 د

نواب جمهوريون يطالبون بإجراء تحقيق بشأن استثمارات ألتمن الشخصية البالغة 3.75 مليار دولار وتضارب المصالح مع OpenAI

وفقاً لـ ChainCatcher، طالب رئيس لجنة الإشراف التابعة لمجلس النواب الأمريكي جيمس كومير مؤخراً الرئيس التنفيذي لشركة OpenAI سام ألتمان بالكشف عن معلومات تتعلق باستثماراته الشخصية وأي تعارض محتمل في المصالح مع OpenAI. تركز استفسارات كومير على محفظة استثمارات ألتمان الواسعة، والتي تبلغ ما يناهز 3.5 مليار دولار صافي ثروته تقريباً، بما في ذلك حصص في Helion وStripe وReddit. وبالتحديد، وفقاً لتقارير من صحيفة وول ستريت جورنال، دفع ألتمان OpenAI للاستثمار بمبلغ 500 مليون دولار في شركة Helion المتخصصة في

GateNewsمنذ 2 س

قامت TT Chain بدمج نظام أمان AegisAI لحماية الأصول الحقيقية على السلسلة (RWA) في 11 مايو

وبحسب إعلان TT Chain الصادر في 11 مايو، قامت شبكة البلوك تشين من الطبقة الثانية بدمج البنية التحتية الأمنية التي تعتمد على الذكاء الاصطناعي من AegisAI ضمن منظومة الأصول الواقعية القابلة للتوكن. يعزز هذا التعاون حماية صفقات الأصول المُرمّزة والعمليات عبر السلاسل من خلال قدرات متقدمة لاكتشاف التهديدات والتدقيق في العقود الذكية. تُشغّل وكلاء الذكاء الاصطناعي المستقلون لدى AegisAI عملية كشف هجمات التصيّد الاحتيالي، ومنع محاولات الوصول غير المصرح بها، وتحديد الثغرات في العقود الذكية في الوقت الفعلي.

GateNewsمنذ 3 س

شركة الذكاء الاصطناعي الناشئة Wispr في محادثات تمويل عند $2B تقييمها في 12 مايو

بحسب PANews، تجري شركة Wispr الناشئة في مجال الذكاء الاصطناعي مفاوضات لجمع التمويل في 12 مايو، بتقييم يبلغ 2 مليار دولار.

GateNewsمنذ 3 س

سيشهد سام ألتمان اليوم في قضية $38M OpenAI المرفوعة من ماسك

وفقاً لـ BlockBeats، من المقرر أن يدلي سام ألتمان بشهادته اليوم (12 مايو) في محكمة اتحادية بمدينة أوكلاند، كاليفورنيا، بشأن دعوى إيلون ماسك ضد OpenAI. سيتولى ألتمان منصة الشهادة بعد أن يَكمل بريت تايلور، رئيس مجلس إدارة OpenAI، الإدلاء بشهادته. قدّم ماسك الدعوى في 2024 متهمًا OpenAI وAltman والرئيس جريج بروكمان بانتهاك مهمة الشركة الأصلية غير الربحية ومهمة المنفعة العامة. ويزعم ماسك أن تبرعه بما يقارب 38 مليون دولار استُخدم لأغراض تجارية غير مُصرّح بها دون الالتزام بالتعهدات الأولية للشركة.

GateNewsمنذ 4 س

عثر Depthfirst على ثغرات إنترنت حرجة بتكلفة تعادل عُشر تكلفة «Mythos» التابعة لشركة Anthropic

ووفقاً لـ BlockBeats، في 12 مايو، أعلنت شركة Depthfirst الناشئة في مجال الأمن السيبراني المدعوم بالذكاء الاصطناعي أن نموذجها لاكتشاف الثغرات الذي طورته بنفسها عثر على عدة عيوب أمنية بالغة الأهمية كانت خُفية عن نموذج Mythos التابع لشركة Anthropic، مدعية أن التكلفة الإجمالية لا تتجاوز عُشر تكاليف الأخير. قال الرئيس التنفيذي لشركة Depthfirst، قاسم ميثاني، إن الشركة يمكنها "إنجاز العمل مقابل 1000 دولار، بينما يتطلب Mythos 10 آلاف دولار للقيام به" من خلال تحسين بنية النموذج لتمتّعه بأداء مخصص لمهمة و

GateNewsمنذ 4 س
تعليق
0/400
لا توجد تعليقات