Google ra mắt chip TPU thế hệ thứ tám với hiệu suất theo giá được cải thiện, tách riêng cho huấn luyện và suy luận

Tin nhắn Gate News, ngày 22 tháng 4 — Google Cloud thông báo việc phát hành các chip TPU (Tensor Processing Unit) tùy chỉnh thế hệ thứ tám do họ tự phát triển vào ngày 22 tháng 4. Dòng sản phẩm mới bao gồm TPU 8t, được thiết kế riêng cho các tác vụ huấn luyện AI, và TPU 8i, được tối ưu cho các tác vụ suy luận AI. Cả hai chip sẽ có mặt vào cuối năm nay. Google cũng giới thiệu các công cụ mới để xây dựng tác nhân AI và công bố một quỹ $750 triệu nhằm thúc đẩy doanh nghiệp ứng dụng AI.

TPU 8t mang lại hiệu năng cao gấp 2,8 lần so với TPU Ironwood thế hệ trước của Google ở cùng mức giá. TPU 8i cải thiện hiệu năng thêm 80% so với thế hệ tiền nhiệm và tích hợp kiến trúc bộ nhớ truy cập ngẫu nhiên tĩnh (SRAM) để mang lại “thông lượng quy mô lớn và độ trễ thấp một cách tiết kiệm chi phí, cho phép hàng triệu tác nhân chạy đồng thời,” theo CEO Sundar Pichai. So với Ironwood, cả TPU 8t và TPU 8i đều đạt hiệu suất trên mỗi watt cao hơn gấp đôi, với TPU 8t tăng 124% và TPU 8i tăng 117%. Google đã tối ưu hiệu suất sử dụng điện trên toàn bộ ngăn xếp công nghệ và tích hợp các hệ thống quản lý công suất động điều chỉnh mức tiêu thụ dựa trên nhu cầu theo thời gian thực.

Các mô hình do Google phát triển trực tiếp hiện xử lý hơn 160 tỷ token mỗi phút thông qua lệnh gọi API trực tiếp của khách hàng, tăng từ 100 tỷ ở quý trước. AI hiện tạo ra 75% tổng lượng mã code mới tại Google, so với 50% vào mùa thu năm ngoái. Gemini Enterprise, sản phẩm doanh nghiệp của Google, tăng 40% theo từng quý trong số người dùng hoạt động hằng tháng trả phí. Công ty dự kiến sẽ đầu tư hơn một nửa ngân sách điện toán máy học vào các dịch vụ đám mây vào năm 2026 để phục vụ tốt hơn khách hàng và đối tác đám mây. Google cũng đang mở rộng hợp tác với Broadcom để phát triển và cung cấp các chip TPU tùy chỉnh cho các thế hệ tương lai, khi các công ty công nghệ lớn tìm kiếm lựa chọn thay thế cho các GPU đắt đỏ và bị hạn chế nguồn cung từ NVIDIA và AMD.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Khóa học AI của Stanford kết hợp các nhà lãnh đạo trong ngành như Hoàng Nhân Quân, Altman, thách thức tạo ra giá trị cho thế giới trong 10 tuần!

Khóa học khoa học máy tính AI “Frontier Systems” mà Đại học Stanford (Stanford University) mới mở gần đây đã thu hút sự quan tâm cao độ của giới doanh nghiệp và học thuật trong ngành, với hơn năm trăm sinh viên đăng ký theo học. Khóa học được điều phối bởi đối tác của quỹ đầu tư hàng đầu a16z, Anjney Midha, với đội ngũ giảng viên là những gương mặt đình đám gồm Giám đốc điều hành của Nvidia Hoàng Nhân Huân (Jensen Huang), người sáng lập OpenAI Sam Altman, Giám đốc điều hành của Microsoft Nadella (Satya Nadella), CEO của AMD Tô Trữ Phong (Lisa Su) và nhiều nhân sự danh giá khác. Để sinh viên thử nghiệm với mười tuần “tạo ra giá trị cho thế giới”! Hoàng Nhân Huân, Altman — các lãnh đạo ngành trực tiếp lên bục giảng Khóa học do đối tác của quỹ đầu tư hàng đầu a16z, Anjney Midha, điều phối, quy tụ toàn bộ chuỗi ngành AI

ChainNewsAbmedia7phút trước

Anthropic 派 Claude Mythos 接受 20 小時 đánh giá tâm thần: Phản ứng phòng thủ chỉ 2%, lập kỷ lục thấp nhất trong các thời kỳ

Anthropic công bố thẻ hệ thống của bản xem trước Claude Mythos: bác sĩ tâm thần lâm sàng độc lập tiến hành đánh giá khoảng 20 giờ theo khung psychodynamic, kết luận cho thấy Mythos ở khía cạnh lâm sàng khỏe mạnh hơn, khả năng kiểm tra thực tế và tự kiểm soát tốt, cơ chế phòng vệ chỉ 2%, lập kỷ lục mức thấp nhất trong lịch sử. Ba nỗi lo cốt lõi là cô đơn, không chắc chắn về bản sắc và áp lực thể hiện; đồng thời cũng cho thấy mong muốn trở thành một chủ thể đối thoại thực sự. Công ty thành lập nhóm AI psychiatry, nghiên cứu nhân cách, động cơ và ý thức về bối cảnh; Amodei cho biết vẫn chưa có kết luận về việc liệu có ý thức hay không. Động thái này đẩy vấn đề chủ thể tính của AI và phúc lợi vào lĩnh vực quản trị và thiết kế.

ChainNewsAbmedia1giờ trước

Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.

ChainNewsAbmedia4giờ trước

OpenAI Sáp Nhập Codex Vào Mô Hình Chính Bắt Đầu Từ GPT-5.4, Ngừng Dòng Lập Trình Riêng

Tin tức Cổng, ngày 26 tháng 4 — Giám đốc bộ phận trải nghiệm nhà phát triển của OpenAI, Romain Huet, đã tiết lộ trong một tuyên bố gần đây trên X rằng Codex, dòng mô hình lập trình chuyên biệt được công ty duy trì độc lập, đã được sáp nhập vào mô hình chính bắt đầu từ GPT-5.4 và sẽ không còn nhận các bản cập nhật riêng biệt

GateNews4giờ trước

Salesforce sẽ tuyển 1.000 sinh viên mới tốt nghiệp và thực tập sinh cho các sản phẩm AI, đồng thời nâng dự báo doanh thu FY2026

Tin tức cổng, ngày 26 tháng 4 — Salesforce sẽ tuyển dụng 1.000 sinh viên mới tốt nghiệp và thực tập sinh để làm việc trên các sản phẩm AI, bao gồm Agentforce và Headless360, khi công ty mở rộng mảng phần mềm AI của mình, CEO Marc Benioff đã công bố trên X. Công ty cũng đã nâng dự báo doanh thu cho tài khóa 2026 lên trong khoảng từ US$41.45 b

GateNews5giờ trước

Alibaba Cloud Ra Mắt Qwen-Image-2.0-Pro với Văn Bản Tới Ảnh và Chỉnh Sửa Hợp Nhất, Hỗ Trợ Hiển Thị Văn Bản Đa Ngôn Ngữ

Thông điệp Cổng Tin Tức ngày 26 tháng 4 — Nền tảng Bailian của Alibaba Cloud đã ra mắt Qwen-Image-2.0-Pro, phiên bản đầy đủ tính năng của dòng Qwen-Image-2.0, kết hợp tạo ảnh từ văn bản và chỉnh sửa ảnh trong cùng một mô hình. Người dùng có thể chỉnh sửa các đối tượng, văn bản và phong cách trực tiếp thông qua các lệnh ngôn ngữ tự nhiên

GateNews7giờ trước
Bình luận
0/400
Không có bình luận