في 1 يونيو 2026، أعلنت شركة NVIDIA خلال مؤتمر GTC في تايبيه أن منصة Vera Rubin دخلت مرحلة الإنتاج الضخم الكامل. في اليوم نفسه، أصبحت شركة CoreWeave، المزود السحابي للذكاء الاصطناعي، أول جهة في القطاع تُكمل نشر منصة Vera Rubin NVL72 والتحقق منها عبر السحابة، حيث أغلق سهمها عند 124.82$ بارتفاع %13.96، وبلغ حجم التداول نحو %90 أعلى من متوسط الأشهر الثلاثة السابقة. لم يكن تزامن هذين الإعلانين مصادفة؛ بل يمثل قفزة جديدة في إمدادات حوسبة الذكاء الاصطناعي، حيث انتقلت من التجارب المخبرية إلى بيئات الإنتاج الفعلي.
النظر إلى Vera Rubin NVL72 كمجرد ترقية لشريحة يُعد تقليلاً كبيراً من أهميتها في القطاع. القضية الجوهرية التي تعالجها هذه النقلة الجيلية هي: مع تجاوز معلمات النماذج حاجز التريليون، وتفوق أعباء الاستدلال على التدريب، ومطالبة الذكاء الاصطناعي القائم على الوكلاء باستجابة في مستوى المللي ثانية، كيف ينبغي تنظيم ونشر واستهلاك وتسعير القدرة الحوسبية؟ لقد قدمت Blackwell مفهوم الحوسبة على مستوى الرف، أما Vera Rubin فدفعت هذا المفهوم إلى أقصاه—مع ست شرائح متطورة تُدار في وقت واحد، ورف مدمج مبرد بالكامل بسائل، وانخفاض كبير في تكلفة الاستدلال—مُعيدة تعريف حدود كفاءة بنية الذكاء الاصطناعي التحتية.
من تطوير الشرائح إلى تكامل الأنظمة: كيف تعيد Vera Rubin تعريف أبعاد المنافسة؟
السرد التقليدي لترقيات وحدات معالجة الرسومات (GPU) الجيلية يتبع سلسلة خطية: تحسين المعالجة ← زيادة عدد الترانزستورات ← زيادة القدرة الحوسبية ← تقليل استهلاك الطاقة. لكن Vera Rubin NVL72 كسرت هذا النمط. لم تعد تركز على وحدة معالجة رسومات واحدة كنقطة بيع رئيسية، بل أصبحت تعرف رفاً كاملاً كوحدة تسليم أصغر للحوسبة الفائقة للذكاء الاصطناعي.
كل رف من Vera Rubin NVL72 يدمج 72 وحدة Rubin GPU و36 وحدة Vera CPU، ويوفر نطاقاً تردديًا على مستوى الرف يصل إلى 260 تيرابايت/ثانية عبر الجيل السادس من NVLink. وتدعي NVIDIA أن هذا النطاق الترددي يفوق إجمالي حركة الإنترنت العالمية. يستخدم النظام حلاً للتبريد السائل بنسبة %100، مما يقلل زمن التركيب من ساعتين في البنى التقليدية إلى خمس دقائق فقط. التحول الحقيقي الكامن وراء هذه المواصفات هو انتقال معيار المنافسة الحوسبية من "TFLOPS للبطاقة الواحدة" إلى "كفاءة النظام على مستوى الرف".
لقد أظهرت Blackwell NVL72 بالفعل إمكانيات الحوسبة على مستوى الرف—1.44 EFLOPS من قدرة الاستدلال، 130 تيرابايت/ثانية من النطاق الترددي الداخلي، وتبريد جزئي بالسائل. أما Vera Rubin NVL72 فطورت هذا المفهوم: قفزت قدرة الاستدلال إلى 3.6 EFLOPS (2.5 ضعف)، وقفزت قدرة التدريب من 10 PFLOPS إلى 35 PFLOPS (3.5 ضعف)، وتمت ترقية ذاكرة GPU من HBM3e إلى HBM4، مع مضاعفة السعة من 141 جيجابايت إلى 288 جيجابايت، وارتفع النطاق الترددي من حوالي 8 تيرابايت/ثانية إلى نحو 22 تيرابايت/ثانية. هذه الأرقام لا تمثل مجرد "مضاعفة الأداء"، بل إعادة هيكلة منهجية للكفاءة. ومن اللافت أن زيادة قدرة الاستدلال (5 أضعاف) تفوقت بشكل كبير على قدرة التدريب (3.5 ضعف). يشير هذا التصميم التفريقي إلى حكم واضح في القطاع: الاستدلال يحل محل التدريب كميدان رئيسي لاستهلاك الحوسبة في الذكاء الاصطناعي.
تآزر الشرائح الست والتبريد السائل الكامل: منطق سلسلة الإمداد والتكلفة وراء الخيارات التقنية
الابتكار في Vera Rubin NVL72 لا يقتصر على ترقية وحدة معالجة واحدة فقط، بل يشمل ست شرائح مصممة حديثاً: Vera CPU، Rubin GPU، مفتاح NVLink 6، بطاقة ConnectX-9 SuperNIC، وحدة BlueField-4 DPU، ومفتاح Spectrum-6 Ethernet. تم تطوير هذه الشرائح والتحقق منها بشكل متزامن، وليس تجميعها بعد تصميم مستقل. تهدف استراتيجية "التكرار المتزامن الكامل" هذه إلى القضاء على فجوات الأداء المزمنة بين الحوسبة والتخزين والشبكات على المستوى التقني، وبناء حواجز دخول أعمق تجارياً مقارنة بعصر Blackwell—حيث يجب على المنافسين المحتملين إتقان تصميم GPU بالإضافة إلى مواكبة التطوير في وحدات المعالجة المركزية، والربط البيني، وبطاقات الشبكة، وDPUs، وشرائح المفاتيح.
يعد حل التبريد السائل بنسبة %100 خياراً تقنياً بارزاً آخر. كل رف Vera Rubin NVL72 يستهلك حوالي 440 كيلوواط، ويعمل عند معامل كفاءة استخدام الطاقة (PUE) يقارب 1.1، ويمكنه استقبال مياه مدخلة بدرجة حرارة تصل إلى 45°م. للمقارنة، تستخدم Blackwell NVL72 تبريداً جزئياً بالسائل مع PUE حوالي 1.25. وبينما يبدو هذا الفرق بسيطاً على مستوى الرف، إلا أنه عند التوسع إلى آلاف الرفوف، يؤدي انخفاض PUE من 1.25 إلى 1.1 إلى توفير كبير في الكهرباء والبنية التحتية للتبريد. وهذا يفسر سبب تطوير CoreWeave وحدتي Valvey (صمام تبريد سائل قابل للبرمجة على مستوى الرف) وRacky (جهاز تحكم موحد للرف) خصيصاً لـ Vera Rubin—حيث ينتقل التبريد السائل من "خيار إضافي" إلى "بنية تحتية أساسية".
ومن القيود الأساسية في سلسلة الإمداد أن التبريد السائل الكامل وتآزر الشرائح الست في Vera Rubin يضيفان عدة عنق زجاجة في الإنتاج. حالياً، يتم توريد ذاكرة HBM4 بشكل رئيسي من قبل Samsung Electronics وSK Hynix. كما أن سرعة زيادة إنتاج مكونات التبريد وتزامن تسليم مكونات النظام قد يحدان من سرعة انتشار Vera Rubin في السوق.
انخفاض تكلفة الاستدلال إلى عُشر: إعادة تعريف اقتصاديات تطبيقات الذكاء الاصطناعي
من بين جميع المواصفات التقنية لـ Vera Rubin NVL72، الأهم اقتصادياً: مقارنة بـ Blackwell، تنخفض تكلفة الاستدلال لكل مليون رمز إلى نحو عُشر، وتزداد كفاءة الاستدلال لكل واط حتى 10 أضعاف، ويمكن تقليل عدد وحدات GPU المطلوبة لنفس أعباء الاستدلال بنسبة تصل إلى ثلاثة أرباع.
تعود هذه النتائج إلى ثلاثة تطورات تقنية: دقة تصنيع 3 نانومتر التي زادت كثافة الترانزستورات (33.6 مليار ترانزستور، أي أكثر بحوالي %60 من Blackwell)، وHBM4 التي ضاعفت عرض نطاق الذاكرة، والجيل السادس من NVLink الذي قلل بشكل أكبر عنق الزجاجة في الاتصال بين وحدات GPU. والأهم من ذلك، أن انخفاض تكلفة الاستدلال يدفع بسيناريوهات تطبيقية كانت غير اقتصادية سابقاً إلى منطقة الجدوى.
خذ على سبيل المثال الوكلاء المستقلين في الزمن الحقيقي: عندما يصبح الذكاء الاصطناعي خدمة تعمل باستمرار وتتخذ قرارات بشكل استباقي بدلاً من أن تكون استدلالاً لمرة واحدة يُطلقه المستخدم، فإن تكلفة المليون رمز تحدد مباشرة ما إذا كان نموذج العمل قابلاً للحياة. ينطبق المنطق ذاته على استدلال السياق طويل المدى بمليون رمز—تحليل كتب كاملة، أو محاضر اجتماعات طويلة، أو فهم قواعد بيانات برمجية كاملة، حيث تستهلك الطلبات المفردة عدداً هائلاً من الرموز. انخفاض التكلفة عشرة أضعاف ينقل هذه المنتجات من "مرحلة العرض التجريبي" إلى "مرحلة التوسع التجاري".
تُظهر بيانات TrendForce أنه في عام 2026، من المتوقع أن تزيد شركات الخدمات السحابية الخمس الكبرى في أمريكا الشمالية القدرة الحوسبية للاستدلال بالذكاء الاصطناعي بنسبة %122، بينما ترتفع قدرة التدريب بنسبة %56 فقط. ينمو الاستدلال أكثر من ضعف سرعة التدريب. هذا التحول البنيوي يعني أن تحسين Vera Rubin للأداء مع التركيز على الاستدلال له أهمية تجارية قوية، وليس مجرد استعراض تقني.
إشارات مبكرة من نشر السحابة: إطلاق CoreWeave وتأثيرات سلسلة القطاع
أعلنت CoreWeave عن نجاح نشر Vera Rubin عبر السحابة في اليوم نفسه الذي بدأ فيه الإنتاج الضخم—وهو توقيت يستحق التحليل. يشير ذلك إلى عدة حقائق متزامنة: التسليم المبكر من سلسلة الإمداد للأجهزة، جاهزية حزمة البرمجيات والتشغيل، وعمق استراتيجي استثنائي في الشراكة بين CoreWeave وNVIDIA.
مسألة جوهرية تتعلق بصحة السرد هي أن ادعاء CoreWeave بأنها "الأولى" محل جدل نسبي. فقد صرحت Microsoft في مارس 2026 بأنها أول مزود سحابي ضخم يتحقق من Vera Rubin NVL72 عبر السحابة (لغرض التحقق). الفرق بين "الأولى في النشر" و"الأولى في التحقق" يعكس تعقيد ادعاءات "الريادة" في منافسة بنية الذكاء الاصطناعي التحتية. فمعايير مثل هذه الادعاءات تخضع لتفسيرات مختلفة بين أصحاب المصلحة.
من منظور سلسلة القطاع، يعتمد نشر Vera Rubin من CoreWeave على خوادم Dell Technologies PowerEdge XE9812 المبردة بالسائل، مع بنية شبكة تدعم كل من NVIDIA Quantum-X800 InfiniBand وSpectrum-X Ethernet. توفر بنية RoCE متعددة المسارات والطائرات نطاقاً خلفياً يبلغ 1.6 تيرابت/ثانية لكل GPU. هذا يعني أن جاهزية منظومة Vera Rubin تتجاوز مورداً واحداً، لتشكل تعاوناً متعدد المستويات من مصنعي الخوادم إلى معدات الشبكة.
سيتم إدراج CoreWeave رسمياً في مؤشر Russell 3000 في 27 يونيو 2026. واعتباراً من 31 مارس 2026، تمتلك NVIDIA حوالي %11 من أسهم CoreWeave. ووفقاً لـ FactSet، يبلغ متوسط توقعات الإيرادات من 31 محللاً لـ CoreWeave في 2026 نحو 12.589 مليار دولار، مع توقع متوسط طويل الأجل لعام 2029 يبلغ 50.458 مليار دولار. وترتبط هذه التوقعات بنمو الإيرادات ارتباطاً وثيقاً بإمدادات الحوسبة من Vera Rubin—حيث سيؤثر التقدم في نشر البنية الجديدة بشكل مباشر على توسيع طاقة CoreWeave وتحقيق إيراداتها.
تأثير متعدد السيناريوهات على القطاع: من خفض تكلفة الاستدلال إلى إعادة هيكلة تنظيم الحوسبة
عند وضع إطلاق Vera Rubin NVL72 في سياق أوسع للقطاع، تظهر ثلاثة مسارات تطورية مترابطة تتكشف في آن واحد.
الأول هو تطور العرض والطلب على الحوسبة. يتغير منحنى النمو من "مدفوع بالتدريب" إلى "مدفوع بالاستدلال". فحاجة الذكاء الاصطناعي القائم على الوكلاء للتشغيل المستمر، وانخفاض الكمون، وارتفاع الإنتاجية توسع الطلب على الحوسبة من بعض مجموعات التدريب الضخمة إلى شبكات بنية تحتية موزعة للاستدلال. وتستجيب خطة Supermicro لمراكز بيانات Vera Rubin (من 5 ميجاواط إلى 1 جيجاواط) لهذا التحول—لم يعد من الضروري احتكار مراكز البيانات العملاقة لإمدادات الحوسبة؛ إذ يمكن لمصانع الذكاء الاصطناعي المتوسطة الحجم نشر أعلى قدرات الحوسبة اقتصادياً.
الثاني هو إعادة هيكلة المنافسة في القطاع. التكرار المتزامن للشرائح الست يعني أن NVIDIA تبني حواجز دخول بشكل منهجي. فبالنسبة للمنافسين المحتملين، اختراق تصميم GPU هو مجرد الخطوة الأولى؛ إذ يجب عليهم أيضاً حل مسائل التنسيق الأمثل بين وحدات المعالجة المركزية، والربط البيني، وDPUs، وبطاقات الشبكة، وشرائح المفاتيح. تتزايد تعقيدات وعمق هذه البنية التقنية بشكل أسي، مما يزيد الضغط على اللاعبين الحاليين للحاق بالركب.
الثالث هو تغير الشروط التجارية لتطبيقات الذكاء الاصطناعي. قد تجعل تكلفة الاستدلال المنخفضة سيناريوهات كانت غير اقتصادية سابقاً قابلة للتطبيق، خاصة تلك التي تتطلب أعباء عمل مستمرة وطويلة الأمد. ومع ذلك، فإن سلسلة نقل هذه الفائدة ليست تلقائية—فالتكيف مع حزمة البرمجيات، وتوافق بنية النماذج مع العتاد الجديد، واستراتيجيات تسعير الخدمات السحابية ستحدد مدى استفادة طبقة التطبيقات فعلياً من انخفاض تكلفة الاستدلال.
في تحليل السيناريوهات، السيناريو الأساسي (الأكثر احتمالاً) هو انخفاض تكلفة الاستدلال بشكل خطي وفق مسار متوقع، مما يدفع إلى تحسين مستمر في هياكل تكلفة تطبيقات الذكاء الاصطناعي، مع تحسن منهجي بين 2027 و2028. أما السيناريو المتسارع (احتمالية متوسطة) فهو أن السوق يستبق الاتجاه الهبوطي للأسعار، وينقل معايير شراء الحوسبة من "الأداء الأقصى" إلى "عدد الرموز لكل واط" و"تكلفة المليون رمز"، مع استبدال الرفوف بالخوادم كوحدة حوسبة أصغر، ويحصل مزودو السحابة الذين يتبنون النظام الجديد مبكراً على أفضلية واضحة. أما سيناريو المخاطر (احتمالية أقل لكنها ليست ضئيلة) فهو وجود تحديات في الإنتاج الضخم أو استقرار سلسلة الإمداد—توافر HBM4، طاقة إنتاج مكونات التبريد، وتزامن تسليم الشرائح الست؛ إذ قد يؤدي التأخير في أي حلقة إلى إبطاء انتشار السوق.
الخلاصة
إطلاق Vera Rubin NVL72 ينقل منطق المنافسة في حوسبة الذكاء الاصطناعي من "تكرار الشرائح" إلى "تكامل الأنظمة". تآزر الشرائح الست، وتصميم الرف كحاسوب، وانخفاض تكلفة الاستدلال بمقدار رتبة كاملة معاً تدفع هذه الموجة الجديدة من ثورة الحوسبة. لقد فتحت Blackwell نافذة الحوسبة على مستوى الرف، وتسعى Vera Rubin لدفع هذه النافذة إلى أقصاها—ليس فقط وحدات معالجة رسومات أسرع، بل إعادة تعريف لكيفية تنظيم ونشر وتسعير حوسبة الذكاء الاصطناعي.
بالنسبة للاعبين في السوق، لم تعد المتغيرات الرئيسية هي "مدى سرعة وحدة GPU القادمة"، بل "مدى سرعة وصول فوائد انخفاض تكلفة الاستدلال إلى طبقة التطبيقات"، و"إلى أي مدى ستعيد تغييرات تنظيم الحوسبة تشكيل تصميم مراكز البيانات والمنافسة بين مزودي السحابة". إن التحقق التعاوني على مستوى القطاع لـ Vera Rubin NVL72 يوفر إجابات أولية، لكن الكفاءة الفعلية بعد النشر واسع النطاق، واستقرار سلسلة الإمداد، واستيعاب الطلب في السوق النهائي لا تزال بحاجة إلى متابعة مستمرة.
الأسئلة الشائعة
ما هي التحسينات الجوهرية لـ Vera Rubin NVL72 مقارنة بـ Blackwell؟
توفر Vera Rubin NVL72 قدرة استدلال على مستوى الرف تبلغ 3.6 EFLOPS—أي 2.5 ضعف Blackwell NVL72 (1.44 EFLOPS)—وتخفض تكلفة الاستدلال لكل مليون رمز إلى نحو عُشر.
لماذا زيادة قدرة التدريب في Vera Rubin (%3.5x) أقل من زيادة قدرة الاستدلال (%5x)؟
يعكس هذا الاختلاف الرؤية الاستراتيجية لـ NVIDIA لاتجاهات القطاع—حيث تنمو أعباء الاستدلال الآن أسرع من التدريب، والبنية الجديدة مُحسنة بشكل أكبر لسيناريوهات الاستدلال.
ماذا يعني أن تكون CoreWeave أول مزود سحابي ينشر Vera Rubin؟
تتجاوز شراكة CoreWeave الهندسية مع NVIDIA العلاقات التقليدية بين العرض والطلب؛ فالنشر الأول يثبت جاهزية حزمة البرمجيات والتشغيل الخاصة بـ Vera Rubin.
ماذا يعني حل التبريد السائل بنسبة %100 لمراكز البيانات؟
يخفض التبريد السائل الكامل في Vera Rubin NVL72 معامل كفاءة استخدام الطاقة (PUE) من حوالي 1.25 (Blackwell) إلى نحو 1.1، مما يؤدي إلى توفير كبير في الكهرباء والبنية التحتية للتبريد عند نشر آلاف الرفوف.
ما هي مخاطر سلسلة الإمداد التي تواجهها Vera Rubin في الإنتاج الضخم؟
يتم توريد ذاكرة HBM4 بشكل رئيسي من قبل Samsung Electronics وSK Hynix؛ كما أن سرعة إنتاج مكونات التبريد وتزامن تسليم الشرائح الست قد يحدان من انتشارها في السوق.
ما هي سيناريوهات التطبيقات الجديدة التي سيمكنها انخفاض تكلفة الاستدلال عشرة أضعاف؟
تشغيل الوكلاء في الزمن الحقيقي بشكل مستمر، واستدلال السياق طويل المدى بمليون رمز، ونشر الاستدلال الموزع على نطاق واسع—وهي سيناريوهات كانت غير اقتصادية سابقاً بسبب ارتفاع تكلفة الرموز—ستصبح ممكنة اقتصادياً.
ما هو أثر إدراج CoreWeave في مؤشر Russell 3000؟
سيدفع الإدراج في مؤشر Russell 3000 إلى تخصيص صناديق المؤشرات المتداولة (ETF) بشكل تلقائي، مما يزيد من إمكانية وصول CoreWeave وسيولتها بين المستثمرين المؤسسيين.
هل غيرت بنية Vera Rubin منطق الاستثمار في بنية الذكاء الاصطناعي التحتية؟
يتحول منطق الاستثمار من "سباق أداء البطاقة الواحدة" إلى "منافسة الكفاءة على مستوى النظام"، حيث تصبح كثافة الحوسبة على مستوى الرف، وعدد الرموز لكل واط، وتكلفة المليون رمز هي المقاييس الجوهرية.




