Karpathy: Nhận thức về năng lực AI xuất hiện một sự đứt gãy nghiêm trọng, phiên bản miễn phí và Agent tiên tiến là “một sản phẩm hoàn toàn khác nhau”

Trước Tổng giám đốc AI của Tesla, đồng sáng lập viên OpenAI Andrej Karpathy vào ngày 9 tháng 4 đã đăng một bài viết dài trên X, chỉ ra rằng nhận thức của công chúng về năng lực của AI đang bị chia rẽ một cách nghiêm trọng. Ông cho rằng, những người sử dụng ChatGPT bản miễn phí và những kỹ thuật viên sử dụng hằng ngày các công cụ agent tiên tiến như Codex, Claude Code thực chất đang thảo luận về « những sản phẩm hoàn toàn khác nhau », nhưng cả hai bên đều tin rằng thứ mình nhìn thấy chính là toàn bộ bức tranh của AI.

Hai thế giới, hai kiểu nhận thức về AI

Karpathy hiện chia những người dùng AI thành hai nhóm.

Nhóm thứ nhất là những người đã thử ChatGPT bản miễn phí vào một thời điểm nào đó trong năm ngoái, rồi từ đó hình thành ấn tượng tổng thể về AI. Họ nhìn thấy vô số sai sót của mô hình — ảo giác, kết quả tìm kiếm lạc lối, và ngay cả các vấn đề đơn giản như chế độ giọng nói “nên lái xe hay đi bộ rồi đến tiệm rửa xe” cũng bị nó làm hỏng. Karpathy thừa nhận rằng những vấn đề này thực sự tồn tại, nhưng nhấn mạnh rằng bản miễn phí và các mô hình đã lỗi thời không thể đại diện cho năng lực thực sự của các mô hình agent tiên tiến trước năm 2026.

Nhóm thứ hai thỏa mãn đồng thời hai điều kiện: trả phí để sử dụng các mô hình agent tiên tiến mới nhất (như OpenAI Codex hoặc Claude Code), và sử dụng chuyên nghiệp trong các lĩnh vực kỹ thuật như phát triển phần mềm, toán học, nghiên cứu. Karpathy gọi nhóm người này đang trải qua cú “tấn công tinh thần AI” (AI Psychosis) ở mức độ cao, bởi những tiến bộ gần đây trong lĩnh vực kỹ thuật của các mô hình này “chỉ có thể mô tả là kinh ngạc” — bạn có thể chứng kiến trực tiếp chúng giải quyết các vấn đề kiến trúc phần mềm vốn trước đó cần tới vài ngày, thậm chí vài tuần, chỉ trong vòng một giờ.

Tại sao sự tiến bộ tập trung mạnh ở lĩnh vực kỹ thuật

Karpathy giải thích lý do vì sao việc nâng cao năng lực AI lại đặc biệt rõ rệt trong các lĩnh vực kỹ thuật như phát triển phần mềm, nhưng trong các mục đích phổ thông như tìm kiếm, viết lách, đưa ra gợi ý thì không nổi bật bằng.

Có hai nguyên nhân: thứ nhất, lĩnh vực kỹ thuật cung cấp hàm thưởng có thể kiểm chứng được (ví dụ: kiểm tra xem unit test có pass hay không), nhờ đó huấn luyện tăng cường học (reinforcement learning) vận hành hiệu quả; trong khi đó, việc đánh giá đúng sai kém của chất lượng bài viết khó xác định một cách rõ ràng. Thứ hai, trong các kịch bản B2B, lĩnh vực kỹ thuật mang giá trị thương mại cao hơn, nên các công ty AI đổ vào những hướng này tỷ lệ lớn nhất nguồn lực của đội ngũ.

Hai nhóm không hiểu nhau đang nói gì

Karpathy kết luận rằng hai nhóm người này đang “mỗi bên nói một câu”. Chế độ giọng nói của OpenAI bản miễn phí làm hỏng các vấn đề thường ngày, còn OpenAI bản trả phí cao cấp Codex thì trong vòng một giờ có thể tái cấu trúc toàn bộ kho mã hoặc phát hiện lỗ hổng của hệ thống — cả hai điều đó đều đúng.

Trong phần phản hồi tiếp theo, ông bổ sung rằng có người đã nêu với ông một quan điểm: sự kiện OpenClaw gây ra sự quan tâm lớn đến vậy trong xã hội, chính là vì nó khiến một lượng lớn người không thuộc giới kỹ thuật lần đầu tiên tiếp cận các mô hình agent tiên tiến, trong khi trước đó họ chỉ biết rằng AI tương đương với ChatGPT phiên bản web.

Bài viết Karpathy: Nhận thức về năng lực AI xuất hiện sự đứt gãy nghiêm trọng, bản miễn phí và agent tiên tiến là “những sản phẩm hoàn toàn khác nhau” lần đầu xuất hiện trên Chainews ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

OpenAI Tuyển Dụng Nhân Tài Hàng Đầu Ngành Phần Mềm Doanh Nghiệp Khi Các Tác Nhân Tuy Tiến Phá Vỡ Ngành

Tin tức Gate News ngày 26 tháng 4 — OpenAI và Anthropic đã tuyển dụng các lãnh đạo cấp cao và kỹ sư chuyên biệt từ các công ty phần mềm doanh nghiệp lớn, bao gồm Salesforce, Snowflake, Datadog và Palantir. Denise Dresser, cựu CEO của Slack thuộc Salesforce, gia nhập OpenAI với vai trò giám đốc doanh thu cấp cao

GateNews2giờ trước

Worxphere Đổi Thương Hiệu JobKorea Với Công Cụ Tuyển Dụng Được Tích Hợp AI

Thông điệp Cổng Tin Tức, ngày 26 tháng 4 — Nền tảng nhân sự của Hàn Quốc Worxphere đã đổi thương hiệu JobKorea khi chuyển từ các bảng tuyển dụng trực tuyến truyền thống sang các giải pháp tuyển dụng dựa trên AI. Công ty đang hợp nhất các dịch vụ, bao gồm JobKorea và Albamon, thành một nền tảng thống nhất bao phủ việc làm lâu dài,

GateNews12giờ trước

Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.

ChainNewsAbmedia14giờ trước

Các Tiểu vương quốc Ả Rập Thống nhất (UAE) Công bố Chuyển hướng sang Mô hình Chính phủ dựa trên AI trong Hai Năm Tiếp theo

H.H. Sheikh Mohammed bin Rashid Al Maktoum cho biết mục tiêu là 50% các lĩnh vực của chính phủ hoạt động thông qua AI tác nhân tự chủ. Quá trình chuyển đổi cũng sẽ bao gồm việc đào tạo các nhân viên liên bang để “thành thạo AI” và sẽ được giám sát bởi Sheikh Mansour bin Zayed. Các điểm chính:

Coinpedia04-25 08:39

Nền tảng giao dịch AI Fere AI huy động 1,3 triệu USD, được dẫn dắt bởi Ethereal Ventures

Tin tức từ Gate, ngày 25 tháng 4 — Fere AI, một nền tảng giao dịch tài sản số được hỗ trợ bởi AI, đã công bố việc hoàn tất một vòng gọi vốn trị giá 1,3 triệu USD do Ethereal Ventures dẫn dắt, với sự tham gia của Galaxy Vision Hill và Kosmos Ventures, theo Globenewswire. Nền tảng hỗ trợ các mạng xuyên chuỗi bao gồm Ethereum, Solana và Base, cho phép người dùng mô tả mục tiêu giao dịch của họ bằng ngôn ngữ tự nhiên trong khi các tác nhân AI thực hiện lệnh giao dịch. Số vốn mới huy động sẽ được phân bổ để mở rộng phát triển nền tảng và tối ưu hóa các chiến lược giao dịch.

GateNews04-25 07:46

Nvidia Triển Khai Tác Nhân AI Codex của OpenAI trên Toàn Bộ Lực Lượng Lao Động với Hạ Tầng Blackwell

Tin từ Gate News, ngày 25 tháng 4 — Nvidia đã triển khai Codex của OpenAI, một tác nhân AI được cung cấp bởi GPT-5.5, cho toàn bộ lực lượng lao động của mình sau một thử nghiệm thành công với khoảng 10.000 nhân viên, theo các trao đổi nội bộ từ CEO Jensen Huang và CEO OpenAI Sam Altman. Codex được thiết kế để hỗ trợ

GateNews04-25 03:11
Bình luận
0/400
Không có bình luận