Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là “đáng ngạc nhiên là tầm thường và dễ gây lỗi” so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A đã trở thành chủ đề thảo luận phổ biến nhất tại hội nghị học thuật ISCA, đưa ra các khuyến nghị cụ thể phù hợp với các tiêu chuẩn kết nối liên ngành trong ngành. Ngược lại, V4 lại còn mơ hồ hơn rất nhiều.

Chan đã phản biện có hệ thống ba khuyến nghị then chốt. Về mức tiêu thụ điện năng, báo cáo cho rằng việc tối ưu hóa phần mềm cho phép chip chạy đồng thời ở mức công suất tối đa cho tính toán, lưu trữ và truyền thông, đồng thời khuyến nghị các nhà sản xuất chip dành ra thêm phần dự trữ công suất. Chan lập luận rằng điều này phản tác dụng: tổng công suất của chip bị giới hạn bởi các hạn chế của quy trình vật lý, do đó việc dành thêm biên công suất chỉ làm giảm tần số hoạt động, cuối cùng kéo giảm hiệu suất tính toán. Đối với truyền dữ liệu GPU-GPU, báo cáo đề xuất mô hình kéo—trong đó các GPU chủ động nạp dữ liệu—thay vì mô hình đẩy, viện dẫn chi phí thông báo cao trong các thao tác đẩy. Chan phản bác điều này, cho rằng mô hình kéo thực ra còn chậm hơn và năng lực bộ điều hợp mạng được cải thiện sẽ là lựa chọn tốt hơn. Tuy nhiên, hai bên có thể đang thảo luận về những lớp khác nhau của vấn đề: báo cáo đề cập đến chi phí do cơ chế thông báo, còn Chan lại nói về độ trễ truyền tải.

Về các hàm kích hoạt, báo cáo khuyến nghị thay thế SwiGLU bằng các hàm đơn giản hơn để giảm gánh nặng tính toán. Chan không thấy có giá trị trong việc này, lưu ý rằng Sonic MoE đã chứng minh hiệu suất tối ưu khi sử dụng SwiGLU. Chan nghi ngờ DeepSeek có thể đã “cố ý làm suy yếu phần này.”

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Google gia tăng thêm 40 tỷ USD đầu tư vào Anthropic: trước tiên chi 10 tỷ, sau đó giải phóng 30 tỷ tùy theo hiệu quả hoạt động, kèm 5GW năng lực tính toán TPU

Tin tức ngành AI

Alphabet tăng thêm khoản đầu tư vào Anthropic lên 40 tỷ USD, theo hai giai đoạn: khoản đầu tiên 10 tỷ USD được rót vào dưới dạng tiền mặt, định giá 380 tỷ USD; 300 tỷ USD còn lại được giải ngân theo từng giai đoạn sau khi đạt các mốc hiệu suất. Trong vòng năm năm, Google Cloud cung cấp 5 GW tài nguyên tính toán TPU; cùng thời điểm, Amazon cũng công bố mức đầu tư tối đa 25 tỷ USD, cho thấy năng lực tính toán và hỗ trợ vốn của Anthropic được tăng cường đồng bộ.

ChainNewsAbmedia19phút trước

Các thương vụ IPO của SpaceX, OpenAI và Anthropic Có Thể Thu Hút Hơn $240 tỷ đô la, Thậm Chí Có Thể Ảnh Hưởng Đến Thanh Khoản Thị Trường Crypto

Kinh tế vĩ mô Cổ phiếu Tin tức ngành AI

Tin tức Cổng, ngày 25 tháng 4 — Theo các báo cáo thị trường, SpaceX dự kiến sẽ lên sàn vào tháng 6 với mục tiêu huy động vốn vượt kỷ lục $29 tỷ đô la của IPO Saudi Aramco, trong khi OpenAI và Anthropic đang lên kế hoạch niêm yết vào nửa sau năm 2026. Ba công ty này được dự đoán sẽ

GateNews1giờ trước

DeepSeek-V4 Bản Xem Trước Được Phát Hành Với Cửa Sổ Ngữ Cảnh 1M, Giải Pháp AI Huawei DCS Cung Cấp Hỗ Trợ Toàn Diện

Tin tức ngành AI

Tin tức Cổng thông tin, ngày 25 tháng 4 — Bản xem trước DeepSeek-V4 đã được phát hành chính thức và mở nguồn, có cửa sổ ngữ cảnh mở rộng 1 triệu token và giới thiệu KV Cache cửa sổ trượt với

GateNews2giờ trước

Thiếu GPU quay trở lại khi Microsoft, Amazon siết chặt nguồn cung; Startup AI đối mặt tăng giá 32% và hàng chờ cuối năm

Cổ phiếu Tin tức ngành AI

Tin tức từ Gate News, ngày 25 tháng 4 — Tình trạng thiếu GPU đang quay trở lại khi các nhà cung cấp đám mây lớn, bao gồm Microsoft và Amazon, tập trung năng lực tính toán cho các đội nội bộ và khách hàng lớn như OpenAI và Anthropic, khiến các startup AI nhỏ hơn phải đối mặt với việc tăng giá, thời gian chờ kéo dài và các điều khoản hợp đồng chặt chẽ hơn.

GateNews3giờ trước

Nvidia Triển Khai Tác Nhân AI Codex của OpenAI trên Toàn Bộ Lực Lượng Lao Động với Hạ Tầng Blackwell

Tác nhân AI Tin tức ngành AI

Tin từ Gate News, ngày 25 tháng 4 — Nvidia đã triển khai Codex của OpenAI, một tác nhân AI được cung cấp bởi GPT-5.5, cho toàn bộ lực lượng lao động của mình sau một thử nghiệm thành công với khoảng 10.000 nhân viên, theo các trao đổi nội bộ từ CEO Jensen Huang và CEO OpenAI Sam Altman. Codex được thiết kế để hỗ trợ

GateNews4giờ trước

Bộ Ngoại giao Hoa Kỳ Cảnh báo về Việc Chưng cất Mô hình AI DeepSeek

Tin tức ngành AI

Bộ Ngoại giao Hoa Kỳ đã phát hành một công điện vào ngày 24 tháng 4 tới các phái bộ ngoại giao và lãnh sự trên toàn thế giới, cảnh báo các chính phủ nước ngoài về nỗ lực của Trung Quốc nhằm sao chép các hệ thống AI của Mỹ thông qua phương pháp chưng cất (distillation), theo Reuters. Công điện

CryptoFrontier4giờ trước

Bình luận

0/400

Không có bình luận