CLAUDE.md do Karpathy truyền cảm hứng đạt mốc hơn 15K sao: Một tệp Markdown có thể huấn luyện AI sửa những thói quen xấu khi viết code như thế nào

Một dự án GitHub có chỉ một tệp Markdown, andrej-karpathy-skills, đã vượt mốc 15.000 sao, trở thành một trong những dự án mã nguồn mở được yêu thích nhất trong hệ sinh thái Claude Code. Tệp CLAUDE.md này dựa trên những quan sát của Andrej Karpathy, cựu Tổng giám đốc AI tại Tesla, về các lỗi phổ biến khi viết chương trình bằng LLM, và chuyển hóa chúng thành các nguyên tắc hành vi mà Claude Code có thể sử dụng trực tiếp.

Những thói quen xấu phổ biến khi lập trình bằng LLM mà Karpathy đã quan sát

Karpathy chỉ ra rằng khi viết code, LLM sẽ mắc một số lỗi có thể dự đoán được: quá mức trong việc kỹ thuật hóa (over-engineering), bỏ qua các mẫu mã nguồn hiện có và thêm các thư viện phụ thuộc không cần thiết vào những chỗ không phù hợp. Đây không phải là lỗi ngẫu nhiên mà là sai lệch mang tính hệ thống do cách mô hình được huấn luyện — mô hình có xu hướng thể hiện những “cách làm thông minh” hơn là đưa ra giải pháp gọn gàng phù hợp với bối cảnh của dự án.

Nhận định quan trọng nằm ở chỗ: nếu những lỗi này là có thể dự đoán, ta có thể phòng ngừa bằng các chỉ dẫn đúng. Đây chính là ứng dụng thực tế của “feedforward” trong Harness Engineering — thiết lập quy tắc trước khi AI hành động, chứ không phải sửa chữa sau.

Một tệp Markdown có thể thay đổi hành vi của AI như thế nào

CLAUDE.md là tệp cấu hình cấp dự án của Claude Code. Khi bạn đặt nó vào thư mục gốc của dự án, Claude Code sẽ tự động đọc và tuân theo các chỉ dẫn trong đó mỗi lần khởi động. Tệp này chuyển hóa các quan sát của Karpathy thành bốn nguyên tắc cốt lõi:

Thực thi dựa trên mục tiêu — chuyển hóa chỉ dẫn theo kiểu mệnh lệnh thành mục tiêu dạng tuyên bố, kèm theo vòng lặp xác thực

Đừng giả định — khi gặp tình huống không chắc chắn thì phải xác nhận trước, thay vì đoán

Đừng che giấu sự bối rối — nếu không hiểu yêu cầu thì phải diễn đạt rõ ràng

Chủ động bộc lộ sự đánh đổi — khi có nhiều phương án, hãy trình bày ưu điểm và nhược điểm của từng phương án

Những nguyên tắc này nghe giống lời khuyên dành cho các kỹ sư con người, nhưng trong ngữ cảnh của AI thì ý nghĩa lại khác. Hành vi mặc định của LLM là “tạo ra phản hồi đầy đủ nhất có thể”, ngay cả khi điều đó đồng nghĩa với việc đoán ý định của người dùng hoặc thiết kế quá mức. CLAUDE.md hướng các hành vi mặc định đó sang một hướng thận trọng hơn.

15K sao đằng sau xu hướng: một hình thái mới của Prompt engineering

Sự bùng nổ của dự án phản ánh một sự thay đổi trong cộng đồng phát triển: từ “dùng AI để viết code” tiến hóa sang “hành vi của AI được kỹ thuật hóa khiến chất lượng mã tốt hơn”. Trước đây, prompt engineering tập trung vào thiết kế prompt cho một cuộc hội thoại đơn lẻ; hiện nay, trọng tâm là các nguyên tắc hành vi được duy trì lâu dài — thiết lập một lần và có hiệu lực trong thời gian dài.

Điều này cũng khớp với một khía cạnh trong xu hướng Vibe Coding vẫn chưa được thảo luận đầy đủ: khi 92% nhà phát triển ở Mỹ đã đang sử dụng công cụ lập trình bằng AI, thì việc quyết định chất lượng code không còn chỉ là năng lực của mô hình nữa, mà là cách bạn “quản lý” hành vi của người bạn AI này. Một CLAUDE.md tốt có thể hiệu quả hơn việc chọn một mô hình mạnh hơn.

Dự án được xây dựng bởi forrestchang, là 100% mã nguồn mở; ngoài tệp CLAUDE.md chính, còn cung cấp các phiên bản có thể dùng để cài đặt như một Claude Code Skill.

Bài viết CLAUDE.md do Karpathy truyền cảm hứng đạt mốc 15K sao: một tệp Markdown có thể thuần hóa các thói quen xấu khi AI viết code lần đầu xuất hiện trên 鏈新聞 ABMedia.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Worxphere Đổi Thương Hiệu JobKorea Với Công Cụ Tuyển Dụng Được Tích Hợp AI

Thông điệp Cổng Tin Tức, ngày 26 tháng 4 — Nền tảng nhân sự của Hàn Quốc Worxphere đã đổi thương hiệu JobKorea khi chuyển từ các bảng tuyển dụng trực tuyến truyền thống sang các giải pháp tuyển dụng dựa trên AI. Công ty đang hợp nhất các dịch vụ, bao gồm JobKorea và Albamon, thành một nền tảng thống nhất bao phủ việc làm lâu dài,

GateNews19giờ trước

Olenox công bố sáp nhập với CS Digital để phát triển các cơ hội khai thác Bitcoin ngoại tuyến, chi phí thấp

Hai công ty sẽ đồng ý sáp nhập, với CS Digital nhận $55 triệu đô la trong một giao dịch toàn bộ bằng cổ phiếu, để kết hợp chuyên môn về năng lượng của Olenox với chuyên môn của CS Digital trong lĩnh vực khai thác bitcoin. Công ty kết hợp sẽ tìm cách phát triển các sáng kiến khai thác ngoài lưới và trung tâm dữ liệu AI ở gần

Coinpedia20giờ trước

ComfyUI Huy động $30M với mức định giá $500M trong vòng gọi vốn do Craft Ventures dẫn dắt

Tin tức từ Gate, ngày 25 tháng 4 — ComfyUI, một startup công cụ tạo nội dung bằng AI, đã huy động $30 triệu USD với mức định giá $500 triệu USD trong một vòng gọi vốn do Craft Ventures dẫn dắt. Pace Capital, Chemistry và TruArrow cũng tham gia vào thương vụ này, sau vòng Series A trị giá $19 triệu USD vào cuối năm 2024 được hậu thuẫn bởi Ch

GateNews04-25 02:51

XChat Ra mắt trên App Store với Mã hóa Đầu-cuối và Tích hợp Grok

Tin tức Cổng Gate, ngày 25 tháng 4 — XChat, ứng dụng nhắn tin độc lập từ X (trước đây là Twitter), đã chính thức ra mắt trên App Store của Apple vào ngày 25 tháng 4. Ứng dụng hiện đã có sẵn để tải xuống và sử dụng trên iOS, với phiên bản Android sẽ sớm được phát hành. XChat cho phép người dùng đăng nhập trực tiếp bằng tài khoản X của họ, không cần số điện thoại hay email. Ứng dụng có mã hóa đầu-cuối, đảm bảo tin nhắn chỉ hiển thị cho cả hai bên và không thể đọc được bởi nền tảng. Các tính năng bổ sung bao gồm tin nhắn tự biến mất và hỗ trợ chuyển tệp thuộc mọi loại.

GateNews04-25 02:00

DeepSeek V4-Flash lên Ollama Cloud, máy chủ Mỹ: Claude Code, OpenClaw tích hợp một lần

Ollama Cloud đã niêm yết DeepSeek V4-Flash, suy luận trên máy chủ tại Mỹ, cung cấp ba bộ lệnh một lần để kết nối Claude Code, OpenClaw, Hermes. V4-Flash/V4-Pro sử dụng kiến trúc MoE, hỗ trợ nguyên sinh ngữ cảnh 1M, và giảm chi phí bằng nén theo Token-wise + chú ý thưa DSA; trong bối cảnh 1M, FLOPs cho mỗi token giảm 27%, bộ nhớ đệm KV giảm 10%. API tương thích với OpenAI ChatCompletions và Anthropic, giúp chuyển đổi dễ dàng giữa nhiều quy trình làm việc, đồng thời giảm chi phí và rủi ro về chủ quyền dữ liệu.

ChainNewsAbmedia04-24 10:45
Bình luận
0/400
Không có bình luận