直到我准备好了,当我感觉到“我想再做点东西了”,而且我不想再用苹果的技术栈了——因为我已经做了太久,而世界已经向前发展了。当时我隐约有种感觉,当你是一个领域的绝对专家,要转向另一个领域时,不仅是“困难”,甚至可以说是“痛苦”。因为你有关于如何构建系统的大量宏观知识,但如果要在没有 AI 辅助工程的情况下真正去实现,你还需要重新学习很多基础知识来迁移你的经验。
后来我就想,不如来看看现在这些 AI 技术到底怎么样。真正让我感到震撼的时刻是,我拿出了一个做到一半的项目(之前在完成它之前我就已经倦怠了)去测试。
**这完全是一步步来的,因为我只是想让我的 AI 智能体(Agent)帮我做点事情,当时还没有统一的愿景。**有趣的是,事情最后又回到了原点:我最初想做一个能查看我 WhatsApp 消息的工具。我甚至为此买了个域名,做了一个原型。但后来我想,那些大实验室肯定会做这个的,我不如等一等,把精力放在其他事情上。我进行了大量的实验,我的初衷其实就是为了好玩,同时启发他人。
Romain Huet: 我刚开始设置它的时候也非常好奇。我心想,这设置挺怪的,但它会把我带向哪里呢?后来我也经历了几次“顿悟时刻”:你给它的访问权限越高,赋予它的工具和技能越多,它的表现就越让你惊叹。你赋予它一项虚拟技能,让它去构建一个网站或应用,甚至为你想要举办的活动写个程序。它不仅能把应用建好,还能使用你的 OpenAI API 密钥往里面加入一些 AI 功能,并将其部署到 Vercel 上。它甚至直接给你生成了一个可以分享给朋友的链接。与仅仅“增强写代码的能力”相比,这完全是思维方式的降维打击。
**现在我也加入了沙盒机制。有人非常自豪地把智能体放在他的 Mac Studio 里,称之为“城堡”。**然后我把它放进了一个极其精简的 Alpine Docker 容器里。你知道,这些模型真的极具创造力。第一次在那个几乎空无一物的容器里时,我让模型去“查看一下这个网站”。它进去后发现:“这系统里连 curl 命令都没有,什么都没有。”我就告诉它:“发挥你的创造力。”
结果,它利用自带的工具、通过 TCP 套接字和 C 编译器,自己手搓了一个简陋版的定制 curl!这样它就能成功访问网站了,而且真的奏效了,简直太疯狂了!所以说,这些智能体拥有不可思议的资源整合能力。
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
“OpenClaw之父”:当“实验项目”变成“全球爆款”,软件开发本质已变——代码已死、意图永生
2月25日,OpenAI在其官方视频栏目中发布了对知名开源项目OpenClaw创建者Peter Steinberger的深度访谈,由OpenAI高管Romain Huet主持。
访谈里,Steinberger复盘了OpenClaw的爆红、自己如何用Codex等“代理式工具”写软件,以及开源与安全的真实矛盾。
几周前还需要主持人“介绍一下”,如今Steinberger在旧金山被上千名用户线下“围观”。他形容自己“各方面都有点超载”,但也直言这正是他想看到的结果:“我一开始就是想激励别人——现在这就是最有趣的形式。”
涌现的智能:“它自己找到了解决问题的路径”
很多人以为OpenClaw是一夜成名,但其背后是长达十个月的疯狂试错。真正让Peter确认这款产品具备极高市场契合度(PMF)的,是AI智能体展现出的“涌现能力”。
Peter把未成熟的AI智能体接入了日常通信软件。某天,有人发来一条语音信息。按照原本的程序逻辑,AI不具备处理这种未知音频文件的能力。然而,令人毛骨悚然又无比兴奋的一幕发生了:AI开始显示“正在输入”。
**“我当时就在想,我根本没写过这个功能,这怎么可能奏效?”**Peter回忆道。
当他询问AI是如何做到的时,AI的回答揭示了当前大模型恐怖的自主规划能力:“你发给我一个没有后缀的文件。我查看了文件头,发现它是Opus音频格式,所以我在电脑上调用了FFmpeg把它转换了。我想转录它,但你没安装Whisper,于是我四处寻找,用curl命令把文件发给了OpenAI的接口,拿回了文本。”
这个细节极具穿透力。AI已经跨越了“你让我写一段代码”的阶段,进化到了“你给我一个问题,我自主调用系统工具链去寻找答案”。
生产力大爆炸:一人,一年,9万次提交
在过去一年里,Peter一个人在GitHub上完成了超过9万次代码提交,横跨120多个项目。这种效率在人类软件工程史上是不可想象的。
**“一年前,这也是绝对不可能的。没有任何模型能让一个人建构出这种规模的东西。”**Peter直言。
他的工作流极其简单粗暴:把一个高达1.5MB、包含所有代码文件的Markdown文档拖进AI模型(如Gemini、Codex),直接写下“给我写个技术规格说明书”,然后输入“构建”。在这个过程中,AI甚至会自己编写测试工具(如Playwright)去走通登录流程并沿途检查错误。
**“当我开始接触这项新技术时,每次都让我多巴胺飙升。我突然意识到,现在我简直可以构建任何东西。”**Peter表示。
这直接触及了当前软件行业的核心痛点:研发成本。以往需要一个架构师、前端、后端、测试组成的完整团队才能跑通的MVP(最小可行性产品),现在一个人在几个小时内就能完成。
“大多数代码都很无聊”:代码在贬值,意图在升值
当代码可以被轻易生成,“写代码”本身就失去了壁垒。
目前,OpenClaw面临着超2000个开源代码合并请求(PR)。但Peter审视这些代码的方式已经完全变了。他不再逐行阅读代码,而是让AI去审查。
“大部分代码都很无聊。它只是将一种数据形状转换为另一种数据形状。我实际上并不关心代码,我关心的是这个人到底想解决什么问题。”
他将现在的开源贡献戏称为“提示词请求(Prompt Request)”。他拿到别人的代码后,第一句话是问AI:“你理解这个PR的意图吗?”随后,他会通过语音与AI讨论这是不是最优解、是否存在架构问题,讨论成熟后,再由AI一键生成并合并代码。
这种范式的转变说明,软件开发的本质已经从“熟练掌握编程语言”变成了“清晰定义问题和管理系统架构”。Peter直言,那些还在用老旧方式手工敲代码的开发者(他称之为VIP coding)会被淘汰。
“我妈能装” vs “黑客乐园”:安全争议把开源推到台前
对于OpenClaw的未来,Steinberger的目标是两头都要:“我想在‘我妈也能装’和‘好玩、可黑’之间找到平衡——这很难。”
他描述OpenClaw长期的默认安装方式其实很“反常规开源”:git clone后源码就在本地,代理“坐在源码里,也知道源码”,不满意就“直接提示它改自己”,近似“自修改软件”。
但这也把安全矛盾放大。他直言“提示注入还没解决”,同时吐槽外界忽略使用边界:项目里的Web服务最初只打算给“可信内网”调试,但有人硬要暴露到公网,然后安全圈再反过来说“没有公网该有的登录限制”。
“我在安全文档里一直喊‘别这么干’,但人们还是会这么用。”
他表示自己已引入安全专家,现实目标是“支持这些用法,同时让大家别一脚踩穿地板”。
给还没上车的人一句话:先玩起来
谈到欧洲开发者对代理工具接受度偏慢,Steinberger的建议非常直白:“用玩心去做。去做一个你一直想做的东西。”
他引用一句流行判断并站队:“我觉得英伟达的CEO说过,短期内,你不会被AI取代,你会被使用AI的人取代。”
最后他抛出时间判断:“我认为在接下来的一年里,这一切将会彻底爆发。”
“人们没有意识到,GPT-5.2在‘这东西能直接跑通’的层面上,又是一次量子级跃迁。我至今仍对它能运作得如此之好感到惊讶。”
访谈全文翻译如下:
风险提示及免责条款