Tin tức Gate, ngày 16 tháng 3, theo dõi của 1M AI News, nhà phân tích ngành Patrick Moorhead đã phát hành báo cáo phân tích trước lễ khai mạc GTC 2026, tập trung vào chủ đề chính của bài phát biểu ngày hôm nay của Nvidia: liệu có thể trình diễn lộ trình hợp tác toàn diện của GPU đào tạo, bộ tăng tốc prefill, bộ giải mã Groq và CPU dưới lớp phần mềm thống nhất hay không. Nhà phân tích chỉ ra rằng, nếu thành công, GTC 2026 sẽ đánh dấu Nvidia hoàn thành chuyển đổi nền tảng; nếu không, câu chuyện sẽ chuyển hướng sang các nhà cung cấp đám mây siêu lớn tự phát triển chip.
Các sự kiện đã xác nhận trong báo cáo bao gồm: Rack Vera Rubin NVL72 (gồm 72 GPU Rubin và 36 CPU Vera, liên kết NVLink 6 với băng thông 3.6TB/s mỗi GPU) đã được triển khai tại AWS, Google Cloud, Microsoft, Oracle, dự kiến sản xuất hàng loạt trong nửa cuối năm; GPU Rubin đạt hiệu năng suy luận gấp 5 lần so với Blackwell với số lượng transistor gấp 1.6 lần, đạt 50 Petaflops suy luận và 35 Petaflops đào tạo; việc mua lại Groq trị giá 20 tỷ USD đã hoàn tất, dựa trên giấy phép không độc quyền, giới thiệu nhà sáng lập Jonathan Ross cùng khoảng 80% đội ngũ kỹ sư, quy mô lớn hơn thương vụ mua lại Mellanox trị giá 7 tỷ USD năm 2019.
Nhà phân tích dự đoán bài phát biểu hôm nay sẽ chính thức ra mắt NemoClaw (nền tảng mã nguồn mở của Nvidia dành cho AI Agent doanh nghiệp), trình bày lộ trình kiến trúc Feynman dự kiến vào năm 2028 (theo báo cáo của tổ chức phân tích, kiến trúc này sẽ sử dụng quy trình TSMC A16 1.6nm), Ross cũng dự kiến sẽ xuất hiện trên sân khấu.
Báo cáo cũng chỉ ra ba rủi ro: Việc tích hợp Groq trong quy mô đám mây siêu lớn vẫn chưa được xác minh, chi phí 20 tỷ USD cho công nghệ chưa thử nghiệm là rất cao; hạn chế về năng lượng là biến số lớn nhất vào năm 2027, gần 40% trung tâm dữ liệu mới xây dựng tập trung tại Texas có nguồn điện dồi dào, trong khi các khu vực ven biển đối mặt với các nút thắt thực sự; dự kiến thị phần AI trung tâm dữ liệu của Nvidia sẽ giảm từ hơn 90% xuống còn khoảng 70% trong hai năm tới.