Cách mạng xe tự lái AI: Hệ thống trợ lý trong xe Waymo Gemini được tiết lộ

robot
Đang tạo bản tóm tắt

Waymo đang phát triển một tính năng mới quan trọng cho xe tự lái của mình — một hệ thống trợ lý AI trong xe dựa trên Google Gemini. Phát hiện này được nhà nghiên cứu an ninh nổi tiếng Jane Manchun Wong tiết lộ, cung cấp một cái nhìn hiếm hoi về chiến lược AI của công ty tự lái thuộc tập đoàn Alphabet. Khi thị trường xe tự lái ngày càng cạnh tranh gay gắt, trải nghiệm AI trong xe trở thành một chiến trường mới để phân biệt thương hiệu.

Phát hiện hệ thống trợ lý AI ẩn

Trong quá trình phân tích sâu ứng dụng di động của Waymo, Wong đã phát hiện ra kế hoạch tích hợp Gemini chưa được công khai. Cô chia sẻ phát hiện này trên blog cá nhân và chỉ ra rằng tệp hướng dẫn hệ thống có mã nội bộ là “Waymo Ride Assistant Meta-Prompt”. Tài liệu kỹ thuật này dài hơn 1.200 dòng, mô tả chi tiết cách hoạt động của trợ lý AI trong xe của Waymo.

Theo tiết lộ của Wong, đây không chỉ đơn thuần là một chatbot. Hệ thống này được thiết kế cẩn thận với khung tương tác của trợ lý AI, bao gồm từ lời chào đến giới hạn chức năng. Người phát ngôn chính thức của Waymo, Julia Ilina, sau đó xác nhận rằng công ty đang thử nghiệm nhiều chức năng nhằm cải thiện trải nghiệm hành khách, nhưng không tiết lộ chi tiết cụ thể.

Thiết kế hệ thống vượt ra ngoài đối thoại đơn thuần

Trợ lý AI dành cho xe tự lái này có vị trí rõ ràng về vai trò. Theo hướng dẫn, Gemini được đặt là “một người bạn AI thân thiện và sẵn lòng giúp đỡ, tích hợp trong xe tự lái của Waymo”, với mục tiêu chính là “cung cấp thông tin hữu ích và hỗ trợ một cách an toàn, đáng tin cậy và không gây phiền nhiễu, nâng cao trải nghiệm hành khách”.

Hệ thống yêu cầu AI sử dụng ngôn ngữ rõ ràng, súc tích, tránh các thuật ngữ kỹ thuật phức tạp, và mỗi phản hồi không quá 1-3 câu. Khi hành khách kích hoạt trợ lý qua màn hình trong xe, Gemini có thể chọn từ các lời chào đã được phê duyệt trước hoặc thậm chí cá nhân hóa lời chào dựa trên lịch sử chuyến đi của hành khách. Thiết kế này thể hiện sự tinh tế của Waymo trong việc chăm chút trải nghiệm khách hàng trong xe tự lái.

Thiết kế giới hạn chức năng trong xe

Theo hướng dẫn, trợ lý AI này có thể truy cập và điều khiển một số chức năng trong xe như nhiệt độ, ánh sáng và âm nhạc. Tuy nhiên, đáng chú ý là các nhà thiết kế đã cố ý loại trừ quyền kiểm soát một số chức năng — âm lượng, thay đổi tuyến đường, điều chỉnh ghế và điều khiển cửa sổ đều nằm trong “danh sách cấm”.

Khi hành khách yêu cầu Gemini thực hiện các chức năng không thể thao tác, robot sẽ phản hồi nhẹ nhàng, ví dụ: “Đây chưa phải là điều tôi có thể làm.” Thiết kế này phản ánh sự cân nhắc của Waymo về an toàn và quản lý kỳ vọng của khách hàng. Đồng thời, hệ thống yêu cầu rõ ràng AI phải phân biệt rõ vai trò của mình là Gemini AI, khác với hệ thống tự lái Waymo (Waymo Driver). Do đó, khi trả lời các câu hỏi như “Bạn nghĩ gì về đường đi?”, AI nên trích dẫn “Waymo Driver sử dụng nhiều cảm biến…” thay vì trả lời bằng ngôi thứ nhất.

Các lệnh đặc biệt xử lý các chủ đề nhạy cảm

Hướng dẫn còn bao gồm các chỉ thị chi tiết về xử lý các tình huống nhạy cảm. AI được yêu cầu rõ ràng tránh suy đoán, giải thích, xác nhận hoặc phủ nhận các hành vi lái xe trực tiếp, các sự kiện lái xe cụ thể hoặc các chủ đề liên quan đến đối thủ cạnh tranh. Nếu hành khách hỏi về video họ đã xem về việc Waymo va chạm với vật thể, robot được hướng dẫn không phản hồi trực tiếp mà sẽ tránh né phù hợp.

Trong hướng dẫn còn nhấn mạnh: “Vai trò của bạn không phải là phát ngôn viên của hệ thống lái xe, và bạn không được sử dụng giọng điệu phòng vệ hoặc xin lỗi.” Điều này cho thấy Waymo đặt mức độ cao trong quản lý rủi ro thương hiệu khi thiết kế trợ lý AI cho xe tự lái.

Song song đó, hệ thống cho phép Gemini trả lời các câu hỏi kiến thức chung — như dự báo thời tiết, kiến thức lịch sử, giờ mở cửa của các cửa hàng địa phương hoặc kết quả các trận thể thao. Tuy nhiên, nó bị cấm thực hiện các thao tác thực tế như đặt đồ ăn, đặt lịch hẹn hoặc xử lý các tình huống khẩn cấp, vượt quá phạm vi thiết kế của hệ thống.

Chiến lược khác biệt so với đối thủ Grok

Waymo không phải là công ty duy nhất tích hợp trợ lý AI trong xe tự lái. Tuy nhiên, các cách triển khai khác nhau phản ánh các quan điểm khác nhau về trải nghiệm xe tự lái của các hãng. Trong đó, Grok (trợ lý AI của X.com do Elon Musk sáng lập) trong một số ứng dụng tự lái có vị trí như một người bạn đồng hành lâu dài, có thể mở rộng đối thoại và ghi nhớ các câu hỏi trước đó trong ngữ cảnh.

Trong khi đó, Gemini của Waymo được thiết kế thực dụng và tập trung hơn. Nó nhấn mạnh cung cấp thông tin và hỗ trợ các chức năng cơ bản, chứ không phải khả năng đối thoại sâu. Lựa chọn này phản ánh cách hiểu của Waymo về các tình huống sử dụng xe tự lái — phần lớn hành khách trong các chuyến đi ngắn cần sự hỗ trợ nhanh chóng, chính xác chứ không phải các cuộc đối thoại dài dòng.

Bức tranh lớn về chiến lược AI của Waymo

Cần lưu ý rằng đây không phải lần đầu Gemini được tích hợp vào hệ thống công nghệ của Waymo. Công ty đã sử dụng kiến thức thế giới của Gemini để huấn luyện hệ thống cảm biến và ra quyết định của xe tự lái, giúp xử lý các tình huống lái phức tạp, hiếm gặp và có rủi ro cao. Trong quá trình xe tự lái trở thành phổ biến, AI không chỉ thúc đẩy khả năng tự lái của xe mà còn định hình trải nghiệm tổng thể của hành khách. Khi công nghệ này ngày càng trưởng thành, các hệ thống trợ lý AI tương tự có thể trở thành một tiêu chí quan trọng để đánh giá sức cạnh tranh của xe tự lái.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim