直到我准备好了,当我感觉到“我想再做点东西了”,而且我不想再用苹果的技术栈了——因为我已经做了太久,而世界已经向前发展了。当时我隐约有种感觉,当你是一个领域的绝对专家,要转向另一个领域时,不仅是“困难”,甚至可以说是“痛苦”。因为你有关于如何构建系统的大量宏观知识,但如果要在没有 AI 辅助工程的情况下真正去实现,你还需要重新学习很多基础知识来迁移你的经验。
后来我就想,不如来看看现在这些 AI 技术到底怎么样。真正让我感到震撼的时刻是,我拿出了一个做到一半的项目(之前在完成它之前我就已经倦怠了)去测试。
**这完全是一步步来的,因为我只是想让我的 AI 智能体(Agent)帮我做点事情,当时还没有统一的愿景。**有趣的是,事情最后又回到了原点:我最初想做一个能查看我 WhatsApp 消息的工具。我甚至为此买了个域名,做了一个原型。但后来我想,那些大实验室肯定会做这个的,我不如等一等,把精力放在其他事情上。我进行了大量的实验,我的初衷其实就是为了好玩,同时启发他人。
Romain Huet: 我刚开始设置它的时候也非常好奇。我心想,这设置挺怪的,但它会把我带向哪里呢?后来我也经历了几次“顿悟时刻”:你给它的访问权限越高,赋予它的工具和技能越多,它的表现就越让你惊叹。你赋予它一项虚拟技能,让它去构建一个网站或应用,甚至为你想要举办的活动写个程序。它不仅能把应用建好,还能使用你的 OpenAI API 密钥往里面加入一些 AI 功能,并将其部署到 Vercel 上。它甚至直接给你生成了一个可以分享给朋友的链接。与仅仅“增强写代码的能力”相比,这完全是思维方式的降维打击。
**现在我也加入了沙盒机制。有人非常自豪地把智能体放在他的 Mac Studio 里,称之为“城堡”。**然后我把它放进了一个极其精简的 Alpine Docker 容器里。你知道,这些模型真的极具创造力。第一次在那个几乎空无一物的容器里时,我让模型去“查看一下这个网站”。它进去后发现:“这系统里连 curl 命令都没有,什么都没有。”我就告诉它:“发挥你的创造力。”
结果,它利用自带的工具、通过 TCP 套接字和 C 编译器,自己手搓了一个简陋版的定制 curl!这样它就能成功访问网站了,而且真的奏效了,简直太疯狂了!所以说,这些智能体拥有不可思议的资源整合能力。
“OpenClaw之父”:当“实验项目”变成“全球爆款”,软件开发本质已变——代码已死、意图永生
2月25日,OpenAI在其官方视频栏目中发布了对知名开源项目OpenClaw创建者Peter Steinberger的深度访谈,由OpenAI高管Romain Huet主持。
访谈里,Steinberger复盘了OpenClaw的爆红、自己如何用Codex等“代理式工具”写软件,以及开源与安全的真实矛盾。
几周前还需要主持人“介绍一下”,如今Steinberger在旧金山被上千名用户线下“围观”。他形容自己“各方面都有点超载”,但也直言这正是他想看到的结果:“我一开始就是想激励别人——现在这就是最有趣的形式。”
涌现的智能:“它自己找到了解决问题的路径”
很多人以为OpenClaw是一夜成名,但其背后是长达十个月的疯狂试错。真正让Peter确认这款产品具备极高市场契合度(PMF)的,是AI智能体展现出的“涌现能力”。
Peter把未成熟的AI智能体接入了日常通信软件。某天,有人发来一条语音信息。按照原本的程序逻辑,AI不具备处理这种未知音频文件的能力。然而,令人毛骨悚然又无比兴奋的一幕发生了:AI开始显示“正在输入”。
**“我当时就在想,我根本没写过这个功能,这怎么可能奏效?”**Peter回忆道。
当他询问AI是如何做到的时,AI的回答揭示了当前大模型恐怖的自主规划能力:“你发给我一个没有后缀的文件。我查看了文件头,发现它是Opus音频格式,所以我在电脑上调用了FFmpeg把它转换了。我想转录它,但你没安装Whisper,于是我四处寻找,用curl命令把文件发给了OpenAI的接口,拿回了文本。”
这个细节极具穿透力。AI已经跨越了“你让我写一段代码”的阶段,进化到了“你给我一个问题,我自主调用系统工具链去寻找答案”。
生产力大爆炸:一人,一年,9万次提交
在过去一年里,Peter一个人在GitHub上完成了超过9万次代码提交,横跨120多个项目。这种效率在人类软件工程史上是不可想象的。
**“一年前,这也是绝对不可能的。没有任何模型能让一个人建构出这种规模的东西。”**Peter直言。
他的工作流极其简单粗暴:把一个高达1.5MB、包含所有代码文件的Markdown文档拖进AI模型(如Gemini、Codex),直接写下“给我写个技术规格说明书”,然后输入“构建”。在这个过程中,AI甚至会自己编写测试工具(如Playwright)去走通登录流程并沿途检查错误。
**“当我开始接触这项新技术时,每次都让我多巴胺飙升。我突然意识到,现在我简直可以构建任何东西。”**Peter表示。
这直接触及了当前软件行业的核心痛点:研发成本。以往需要一个架构师、前端、后端、测试组成的完整团队才能跑通的MVP(最小可行性产品),现在一个人在几个小时内就能完成。
“大多数代码都很无聊”:代码在贬值,意图在升值
当代码可以被轻易生成,“写代码”本身就失去了壁垒。
目前,OpenClaw面临着超2000个开源代码合并请求(PR)。但Peter审视这些代码的方式已经完全变了。他不再逐行阅读代码,而是让AI去审查。
“大部分代码都很无聊。它只是将一种数据形状转换为另一种数据形状。我实际上并不关心代码,我关心的是这个人到底想解决什么问题。”
他将现在的开源贡献戏称为“提示词请求(Prompt Request)”。他拿到别人的代码后,第一句话是问AI:“你理解这个PR的意图吗?”随后,他会通过语音与AI讨论这是不是最优解、是否存在架构问题,讨论成熟后,再由AI一键生成并合并代码。
这种范式的转变说明,软件开发的本质已经从“熟练掌握编程语言”变成了“清晰定义问题和管理系统架构”。Peter直言,那些还在用老旧方式手工敲代码的开发者(他称之为VIP coding)会被淘汰。
“我妈能装” vs “黑客乐园”:安全争议把开源推到台前
对于OpenClaw的未来,Steinberger的目标是两头都要:“我想在‘我妈也能装’和‘好玩、可黑’之间找到平衡——这很难。”
他描述OpenClaw长期的默认安装方式其实很“反常规开源”:git clone后源码就在本地,代理“坐在源码里,也知道源码”,不满意就“直接提示它改自己”,近似“自修改软件”。
但这也把安全矛盾放大。他直言“提示注入还没解决”,同时吐槽外界忽略使用边界:项目里的Web服务最初只打算给“可信内网”调试,但有人硬要暴露到公网,然后安全圈再反过来说“没有公网该有的登录限制”。
“我在安全文档里一直喊‘别这么干’,但人们还是会这么用。”
他表示自己已引入安全专家,现实目标是“支持这些用法,同时让大家别一脚踩穿地板”。
给还没上车的人一句话:先玩起来
谈到欧洲开发者对代理工具接受度偏慢,Steinberger的建议非常直白:“用玩心去做。去做一个你一直想做的东西。”
他引用一句流行判断并站队:“我觉得英伟达的CEO说过,短期内,你不会被AI取代,你会被使用AI的人取代。”
最后他抛出时间判断:“我认为在接下来的一年里,这一切将会彻底爆发。”
“人们没有意识到,GPT-5.2在‘这东西能直接跑通’的层面上,又是一次量子级跃迁。我至今仍对它能运作得如此之好感到惊讶。”
访谈全文翻译如下:
风险提示及免责条款