Alibaba's PAI phát hành mô hình AgenticQwen mã nguồn mở: Phiên bản 8B tiến gần hiệu năng 235B nhờ dual data flywheels

Tin tức Cổng, 27 tháng 4 — Nhóm PAI của Alibaba đã phát hành và mã nguồn mở AgenticQwen, một mô hình ngôn ngữ dạng tác nhân quy mô nhỏ được thiết kế cho các ứng dụng gọi công cụ ở mức công nghiệp. Mô hình có hai phiên bản: 8B và 30B-A3B. Được huấn luyện thông qua một khung học tăng cường “dual data flywheel” sáng tạo, AgenticQwen đạt được các năng lực cấp độ tác nhân gần tương đương mô hình hàng nghìn tỷ tham số, đồng thời giảm đáng kể chi phí suy luận.

Cơ chế dual data flywheel giải quyết vấn đề đồng nhất hóa trong dữ liệu tổng hợp truyền thống. Flywheel lý luận tự động tạo ra các biến thể khó hơn từ lỗi của mô hình, trong khi flywheel tác nhân mở rộng các quy trình tuyến tính đơn giản (như các quy trình đặt chỗ) thành các cây hành vi nhiều nhánh có ràng buộc, các tình huống bị từ chối và điều kiện đối kháng, mô phỏng các kịch bản ra quyết định phức tạp trong thực tế. Các bài benchmark cho thấy AgenticQwen-8B đạt 47.4 trên các benchmark môi trường công cụ thực tế (TAU-2 và BFCL-V4), vượt xa đáng kể Qwen3-8B gốc (23.8) và tiệm cận Qwen3-235B (52.0). AgenticQwen-30B-A3B (với chỉ 3B tham số được kích hoạt) đạt 50.2.

Mô hình đã được triển khai trong các hệ thống sản xuất nội bộ tương tự Manus, thu hẹp đáng kể khoảng cách với các mô hình 235B về thời gian suy luận end-to-end. Tuy nhiên, mô hình bị giới hạn bởi độ dài ngữ cảnh gốc 40K token, điều này hạn chế hiệu năng của nó đối với các tác vụ tìm kiếm sâu.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Gate tổ chức Space thảo luận bàn tròn về AI Trading vào ngày 28 tháng 4: Khám phá AI như động lực của chu kỳ Web3 tiếp theo

Tin tức Cổng (Gate), ngày 27 tháng 4 — Gate sẽ tổ chức một buổi thảo luận bàn tròn trực tiếp trên Space về AI Trading vào ngày 28 tháng 4 lúc 8 giờ tối, quy tụ các chuyên gia trong ngành để tìm hiểu liệu việc AI tích hợp sâu vào các quy trình giao dịch có đánh dấu điểm khởi đầu thực sự của chu kỳ Web3 tiếp theo hay không. Cuộc thảo luận sẽ xem xét sự phát triển của cơ sở hạ tầng AI, sự chuyển đổi cấu trúc giao dịch và những thay đổi trong các mô hình tài chính. Các diễn giả sẽ phân tích cách AI đang chuyển từ một công cụ phân tích độc lập thành một trung tâm giao dịch cốt lõi, từ đó thay đổi căn bản động lực trò chơi của các thị trường tài chính. Để tham gia, người dùng hãy theo dõi @sunpumpmeme và @Agent_SunGenX, retweet bài đăng sự kiện và gắn thẻ ba người bạn. Năm người tham gia may mắn sẽ được chọn ngẫu nhiên để nhận 10 USDT mỗi người.

GateNews2giờ trước

Ant Group Ra Mắt Ling-2.6-1T: Mô Hình Hàng Nghìn Tỷ Tham Số Tối Ưu Cho Việc Thực Thi Tác Vụ Tiết Kiệm Token

Tin từ Gate News, 27 tháng 4 — Ant Group's inclusionAI đã phát hành Ling-2.6-1T, một mô hình chỉ dẫn cỡ hàng nghìn tỷ tham số mới trong dòng Ling, có quy mô flagship. Khác với các mô hình suy luận chuỗi dài, Ling-2.6-1T sử dụng cơ chế "Fast-Thinking" được thiết kế để thực thi tác vụ chính xác với lượng token tối thiểu

GateNews3giờ trước

API của Nansen Giờ Hỗ Trợ Giao thức MPP của Tempo, Cho Phép Tác nhân AI Thanh toán Theo Từng Lần Gọi

Tin tức từ Gate, ngày 27 tháng 4 — API của Nansen hiện đã hỗ trợ Giao thức Thanh toán Máy (MPP), một chuẩn dành cho các khoản thanh toán tự động giữa máy với máy được hỗ trợ bởi Tempo và Stripe. Tích hợp này cho phép các tác nhân AI thanh toán trực tiếp từ ví của họ theo từng lần gọi. Tính năng này hoạt động song song với

GateNews3giờ trước

OpenAI's Greg Brockman: AI Shifting from Chat to Autonomous Task Execution

Gate News message, April 27 — Greg Brockman, president and co-founder of OpenAI, says the next wave of artificial intelligence will move users from chatting with AI bots to assigning real-world tasks. This shift requires enterprises to rethink operational workflows and establish new protocols for se

GateNews4giờ trước

CEX lớn ra mắt Smart Money Signal Suite với dữ liệu từ hơn 1.000 nhà giao dịch

Tin tức Gate, ngày 27 tháng 4 — Một sàn giao dịch tập trung lớn đã ra mắt "Smart Money Signal Suite" tích hợp dữ liệu nắm giữ theo thời gian thực, tỷ lệ thắng và lãi/lỗ từ hơn 1.000 nhà giao dịch phổ biến. Bộ công cụ, có thể truy cập thông qua Agent Trade Kit của nền tảng, mã hóa các tín hiệu giao dịch dưới dạng các công cụ có thể gọi bởi AI Agent.

GateNews4giờ trước

B.AI Nâng Cấp Cơ Sở Hạ Tầng, Ra Mắt Các Tính Năng Kỹ Năng Lớn

Tin tức của Gate, ngày 27 tháng 4 — B.AI đã công bố nhiều tiến bộ về sản phẩm và hệ sinh thái trong tuần này. Trang đích BAIclaw đã được đại tu hoàn toàn về giao diện trực quan và tương tác, đồng thời hỗ trợ đa ngôn ngữ trên website được mở rộng lên 10 ngôn ngữ, giúp nâng cao khả năng sử dụng trên phạm vi toàn cầu. Ở mảng hạ tầng

GateNews5giờ trước
Bình luận
0/400
Không có bình luận