Nhân viên của OpenAI đã công khai chỉ trích kết quả kiểm tra Điểm chuẩn của Grok3 là có tính đa nghĩa

GoldenOctober2024
GROK-1,76%
XAI55,35%

Vào ngày 23 tháng 2, một nhân viên của OpenAI đã công khai cáo buộc công ty xAI của Elon Musk, nói rằng kết quả kiểm tra chuẩn Điểm của mô hình AI mới nhất Grok3 do nó phát hành là sai lệch. Đáp lại, đồng sáng lập xAI Igor Babushkin khẳng định rằng công ty không sai. Biểu đồ của xAI cho thấy hai phiên bản của Grok3 - Grok3 Reasoning Beta và Grok3 mini Reasoning - vượt trội so với mô hình mạnh nhất hiện có của OpenAI, o3-mini-high, tại AIME 2025. Tuy nhiên, các nhân viên của OpenAI đã nhanh chóng chỉ ra trên nền tảng X rằng biểu đồ của xAI không bao gồm điểm AIME 2025 là o3-mini-cao trong điều kiện “cons@64”. Babushkin lập luận trên nền tảng X rằng OpenAI đã đăng các biểu đồ thử nghiệm chuẩn Điểm gây hiểu lầm tương tự trong quá khứ. Mặc dù các biểu đồ này được sử dụng để so sánh hiệu suất của các mô hình của riêng họ.

Xem bản gốc
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Birakenewekovip
· 2025-02-23 03:48
Thị trường tăng 🐂
Xem bản gốcTrả lời0
Renatinho25vip
· 2025-02-23 02:47
Đầu tư 🚀
Xem bản gốcTrả lời0