Mất nhiều ngày để thử nghiệm OpenAI Codex


Ngay cả khi mở chế độ GPT-5.4 xhigh (mức suy luận cao nhất), khi dùng làm mô hình chính vẫn mắc nhiều lỗi.
Ví dụ, một lần là hiểu sai lệnh, trực tiếp xóa những thứ không nên xóa. Một lần nữa còn kỳ quặc hơn: nó nghĩ rằng đã ghi thành công, thực tế thì không hề có. Cùng một lỗi đó xảy ra ba lần, mỗi lần đều do Opus review sau mới phát hiện ra.
Hiện tại, kết luận của tôi là Codex rất phù hợp làm công cụ hỗ trợ, đưa ra nhiệm vụ mã rõ ràng thì nó sẽ làm nhanh và tốt. Nhưng để làm mô hình chính hiểu các lệnh phức tạp nhiều bước, hoặc quyết định có nên hành động hay không? Thì vẫn còn thiếu một chút.
Hiện tại vẫn chủ yếu dựa vào Opus 😎
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim