Giám đốc điều hành Google DeepMind: Mọi công ty sản phẩm AI đều nên xây dựng các bộ chuẩn tùy chỉnh

Tin tức Gate ngày 27 tháng 4 — Logan Kilpatrick, quản lý sản phẩm cấp cao tại Google DeepMind và là người phụ trách sản phẩm của Google AI Studio, cho biết trên X rằng mọi công ty đang xây dựng các sản phẩm dựa trên AI đều nên thiết lập các bộ chuẩn tùy chỉnh của riêng mình để đo hiệu suất của mô hình AI. Ông mô tả đây là một cách để làm cho các cải tiến mô hình “mang lại lợi ích một cách không tương xứng cho công ty của bạn” và kêu gọi những người sáng lập cùng lãnh đạo doanh nghiệp hãy “bắt đầu từ ngày mai.”

Hầu hết các công ty hiện nay dựa vào các bảng xếp hạng công khai để lựa chọn mô hình AI, nhưng những bảng này đo các năng lực chung thường không khớp với các kịch bản kinh doanh cụ thể. Kilpatrick nêu ví dụ về một công ty rà soát hợp đồng vốn đặc biệt quan tâm đến độ chính xác trích xuất điều khoản — một năng lực không có trong các bộ chuẩn công khai, khiến việc đánh giá hiệu suất mô hình trên nhiệm vụ đó là không thể. Các bộ chuẩn tùy chỉnh mang lại hai lợi thế chính: thứ nhất, chúng cho phép các công ty đánh giá từng lần cập nhật mô hình dựa trên các nhiệm vụ kinh doanh của chính họ và chọn mô hình hoạt động tốt nhất trong tình huống sử dụng thực tế của mình thay vì mô hình được xếp hạng cao nhất nói chung; thứ hai, chúng cho phép các công ty chia sẻ các bộ kiểm thử này với các nhà cung cấp mô hình, thúc đẩy tối ưu hóa liên tục trong những lĩnh vực quan trọng đối với doanh nghiệp của họ.

Kilpatrick cho biết các công ty như Zapier và Sierra đã đang triển khai cách tiếp cận này, khẳng định rằng “có rất nhiều alpha có thể được tạo ra ở đây.”

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenAI's Greg Brockman: AI Shifting from Chat to Autonomous Task Execution

Gate News message, April 27 — Greg Brockman, president and co-founder of OpenAI, says the next wave of artificial intelligence will move users from chatting with AI bots to assigning real-world tasks. This shift requires enterprises to rethink operational workflows and establish new protocols for se

GateNews1phút trước

B.AI Nâng Cấp Cơ Sở Hạ Tầng, Ra Mắt Các Tính Năng Kỹ Năng Lớn

Tin tức của Gate, ngày 27 tháng 4 — B.AI đã công bố nhiều tiến bộ về sản phẩm và hệ sinh thái trong tuần này. Trang đích BAIclaw đã được đại tu hoàn toàn về giao diện trực quan và tương tác, đồng thời hỗ trợ đa ngôn ngữ trên website được mở rộng lên 10 ngôn ngữ, giúp nâng cao khả năng sử dụng trên phạm vi toàn cầu. Ở mảng hạ tầng

GateNews15phút trước

Bắc Kinh yêu cầu dỡ bỏ lệnh cấm giao dịch! Meta đã rót 2 tỷ USD để mua lại công ty khởi nghiệp AI tại Trung Quốc Manus nhưng thương vụ thất bại

Ủy ban Phát triển và Cải cách Quốc gia Trung Quốc hôm nay (ngày 27 tháng 4) chính thức ban hành thông báo. Văn phòng Cơ chế công tác thẩm tra an ninh đầu tư nước ngoài đã “theo đúng pháp luật và đúng quy định đưa ra quyết định cấm đầu tư đối với việc nhà đầu tư nước ngoài mua lại dự án Manus, đồng thời yêu cầu các bên liên quan hủy bỏ giao dịch mua lại đó”. Đây là, kể từ khi các “Biện pháp thẩm tra an ninh đầu tư nước ngoài” của Trung Quốc được thực thi, một số ít trường hợp sử dụng biện pháp xử lý “cấm đầu tư” với mức độ cao nhất và yêu cầu hủy bỏ giao dịch đã được xác lập. Meta đổ 2 tỷ USD, mua vào ứng dụng AI rẻ nhất Thời gian quay lại ngày 29 tháng 12 năm 2025. Meta công bố việc mua lại startup AI đại lý Trung Quốc Manus, thị trường dự đoán giá nằm trong khoảng từ 2 đến 3 tỷ USD. Manus là AI đa năng do Công ty phát triển Công nghệ Butterfly Effect ở Bắc Kinh phát triển, sau khi ra mắt vào ngày 6 tháng 3 năm 2025, nhờ thành tích nổi bật trong benchmark GAIA nên chỉ trong một đêm

ChainNewsAbmedia29phút trước

Cổ phiếu IPO của Xizhi Technology-P Tăng Hơn 360% Trên Thị Trường Chợ Đen, Mức Tăng Thu Hẹp Còn 320%

Tin từ Gate News, ngày 27 tháng 4 — Xizhi Technology-P (01879.HK), một công ty chip AI niêm yết tại Hồng Kông, chứng kiến cổ phiếu của mình tăng vọt hơn 360% trên thị trường chợ đen (dark market) vào đầu ngày hôm nay, dù mức tăng sau đó đã thu hẹp còn 320%. Cổ phiếu đang được giao dịch trước khi lên sàn IPO chính thức tại Hồng Kông

GateNews41phút trước

Dùng AI để tăng năng suất hay giảm chi phí? Nâng gấp trăm lần hiệu suất không đi kèm gấp trăm lần doanh thu, nhưng ở Thung lũng Silicon không ai dám kêu dừng

Nhà đầu tư hợp danh của Fiveyuan Capital là Meng Xing, gần đây đã công bố báo cáo khảo sát Thung lũng Silicon, đưa ra một nhận định đến mức ngay cả chính anh cũng phải thay đổi thói quen ghi chép: Thung lũng Silicon đang bước vào một giai đoạn mà ngay cả người “cố tạo sóng” cũng bị sóng nhấn chìm. Tốc độ lặp phiên bản của AI đã chuyển từ “theo tháng” sang “theo tuần”, đến ngay cả Thung lũng Silicon cũng không theo kịp chính mình. Khi AI khuếch đại năng suất của một đội nhóm lên gấp năm lần, bạn có thể giảm tới tám phần mười nhân lực để duy trì sản lượng như cũ, hoặc giữ nguyên số người để làm gấp năm lần. Quan sát của Meng Xing lần này tại Thung lũng Silicon, tương đương với việc tại chỗ đưa ra bản nháp câu trả lời: khi hiệu suất 100 lần không đổi lấy doanh thu 100 lần, khi ngân sách token tiến sát chi phí nhân lực, khi động cơ hơi nước còn chưa chạy nhanh hơn xe ngựa mà chẳng ai dám dừng lại, thì Thung lũng Silicon hiện đang chọn “tăng tốc độ lên trước rồi tính sau”. Nhưng cuối cùng con đường này sẽ dẫn tới “năng lực mở rộng” hay “cắt giảm chi phí”, hiện vẫn chưa có kết luận. YC từ các chỉ báo dẫn đầu chuyển sang các chỉ báo tụt hậu Meng Xing năm nay

ChainNewsAbmedia1giờ trước
Bình luận
0/400
Không có bình luận