Tencent Phát hành và Mở Mã Nguồn Bản Xem Trước Hunyuan Hy3 với 295B Tham Số

Tin Cổng ngõ, ngày 23 tháng 4 — Tencent đã giới thiệu và mở mã nguồn bản xem trước Hunyuan Hy3, một mô hình ngôn ngữ lai dạng hỗn hợp chuyên gia (mixture-of-experts) kết hợp tư duy nhanh và chậm. Mô hình bao gồm tổng cộng 295 tỷ tham số với 21 tỷ tham số hoạt động, hỗ trợ độ dài ngữ cảnh tối đa 256K token. Bản xem trước Hy3 là mô hình đầu tiên được huấn luyện sau quá trình tái cấu trúc của Hunyuan và là mô hình thông minh nhất của Tencent cho đến nay. Công ty cho biết đã có những cải thiện đáng kể về suy luận phức tạp, tuân theo hướng dẫn, học tập trong ngữ cảnh, tạo mã, năng lực mang tính tác nhân (agentic), và hiệu năng suy luận. Nhà khoa học AI trưởng Yao Shunyu cho biết bản xem trước Hy3 đánh dấu bước đầu tiên trong quá trình tái thiết của Hunyuan và bày tỏ hy vọng rằng phản hồi từ cộng đồng mã nguồn mở sẽ nâng cao tính hữu dụng thực tiễn của phiên bản chính thức.

Tencent đồng thời đang mở rộng huấn luyện trước (pretraining) và học tăng cường (reinforcement learning) để nâng trần trí tuệ của mô hình, đồng thời hợp tác với nhiều sản phẩm của Tencent thông qua đồng thiết kế sâu (deep co-design) nhằm cải thiện hiệu năng trong thế giới thực. Công ty cũng bắt đầu khám phá các năng lực của mô hình chuyên biệt.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.

ChainNewsAbmedia1giờ trước

OpenAI Sáp Nhập Codex Vào Mô Hình Chính Bắt Đầu Từ GPT-5.4, Ngừng Dòng Lập Trình Riêng

Tin tức Cổng, ngày 26 tháng 4 — Giám đốc bộ phận trải nghiệm nhà phát triển của OpenAI, Romain Huet, đã tiết lộ trong một tuyên bố gần đây trên X rằng Codex, dòng mô hình lập trình chuyên biệt được công ty duy trì độc lập, đã được sáp nhập vào mô hình chính bắt đầu từ GPT-5.4 và sẽ không còn nhận các bản cập nhật riêng biệt

GateNews1giờ trước

Salesforce sẽ tuyển 1.000 sinh viên mới tốt nghiệp và thực tập sinh cho các sản phẩm AI, đồng thời nâng dự báo doanh thu FY2026

Tin tức cổng, ngày 26 tháng 4 — Salesforce sẽ tuyển dụng 1.000 sinh viên mới tốt nghiệp và thực tập sinh để làm việc trên các sản phẩm AI, bao gồm Agentforce và Headless360, khi công ty mở rộng mảng phần mềm AI của mình, CEO Marc Benioff đã công bố trên X. Công ty cũng đã nâng dự báo doanh thu cho tài khóa 2026 lên trong khoảng từ US$41.45 b

GateNews1giờ trước

Alibaba Cloud Ra Mắt Qwen-Image-2.0-Pro với Văn Bản Tới Ảnh và Chỉnh Sửa Hợp Nhất, Hỗ Trợ Hiển Thị Văn Bản Đa Ngôn Ngữ

Thông điệp Cổng Tin Tức ngày 26 tháng 4 — Nền tảng Bailian của Alibaba Cloud đã ra mắt Qwen-Image-2.0-Pro, phiên bản đầy đủ tính năng của dòng Qwen-Image-2.0, kết hợp tạo ảnh từ văn bản và chỉnh sửa ảnh trong cùng một mô hình. Người dùng có thể chỉnh sửa các đối tượng, văn bản và phong cách trực tiếp thông qua các lệnh ngôn ngữ tự nhiên

GateNews3giờ trước

API DeepSeek V4-Pro giảm 75% đến ngày 5 tháng 5, giá đầu ra giảm xuống còn $0.87 mỗi một triệu token

Tin tức từ Gate, ngày 26 tháng 4 — DeepSeek đã công bố giảm giá 75% trong thời gian giới hạn đối với giá API V4-Pro, có hiệu lực đến ngày 5 tháng 5 lúc 15:59 UTC. Sau khi giảm giá, giá cho mỗi một triệu token là: hit bộ nhớ cache đầu vào $0.03625

GateNews4giờ trước

Anthropic Triển khai các biện pháp bảo vệ bầu cử cho Claude trước thềm cuộc bầu cử giữa nhiệm kỳ năm 2026

Anthropic đã công bố vào thứ Sáu một loạt biện pháp nhằm bảo vệ tính toàn vẹn bầu cử, được thiết kế để ngăn chatbot AI Claude của hãng bị biến thành công cụ vũ khí nhằm lan truyền thông tin sai lệch hoặc thao túng cử tri trước thềm cuộc bầu cử giữa kỳ năm 2026 tại Mỹ và các cuộc tranh cử lớn khác trên khắp thế giới trong năm nay. Trụ sở tại San Francisco-based

CryptoFrontier9giờ trước
Bình luận
0/400
Không có bình luận