五源資本合夥人孟醒,近日發表矽谷考察報告,提出一個讓他自己都改變記筆記習慣的判斷:矽谷正在進入一個連造浪的人都被浪淹沒的階段。AI 的迭代速度已經從「按月」變成「按週」,連矽谷自己都跟不上自己。
當 AI 把一個團隊的生產力放大五倍,你可以減少八成人力維持原本產出,也可以維持人數做五倍的事。孟醒這次矽谷的觀察,等於是在現場給出了答案的初稿:當 100 倍效率沒有換來 100 倍營收,當 token 預算逼近人力成本,當蒸汽機還跑不過馬車卻沒人敢停下,矽谷現在選的是「先把速度衝上去再說」。但這條路最終會走到「擴張能力」還是「壓縮成本」,目前沒有定論。
YC 從領先指標變成落後指標
孟醒今年 3 月坐在 YC W26 batch Demo Day 觀眾席,聽到第五家公司路演時就放下了筆。原因是這一屆超過一百家公司中,約 80% 都在做垂直 agent,例如幫律師整理文件、幫客服分發工單、幫 HR 篩選履歷。
如果是去年 10 月看到這些題目,他會覺得「挺有想法」。但 Claude Code 從開發者工具變成幾乎人人可用的介面、Opus 4.6 把 vibe coding 的門檻壓到地板之後,這些垂直 agent 在尚未建立業務壁壘前,一個普通工程師花一個週末就能複製出來。
YC 的批次制度從申請、篩選、入營、打磨到路演,是按一個更慢的世界設計的。在當前 AI 的迭代速度下,5 個月足夠發生數輪典範轉移。孟醒形容,YC 正從過去的領先指標逐漸變成落後指標。
Meta 全員用對手的產品寫程式
孟醒這次矽谷之行最大的衝擊,是 Meta 整間公司全員都在使用 Claude Code。一家市值兆級的公司,讓幾萬名工程師用競爭對手的 API 接觸自家程式碼,這在半年前完全不可想像。
Meta 內部曾推出名為 myclaw 的工具試圖解決程式碼安全問題,但「不好用,沒人用」。最後公司直接放寬政策,只要不涉及客戶資料,員工可自由使用 Claude Code,並開始召開「如何變成 AI native 組織」的內部會議與培訓。
Google 因安全考量原則上禁止員工使用對手工具,但 DeepMind 是例外,負責 Gemini 與內部應用的幾個團隊都在用 Claude Code。Google 自家內部編碼工具 Antigravity 號稱目前約 50% 的新程式碼由 AI 編寫,仍無法阻擋 DeepMind 的偏好。
其中一個關鍵是 Anthropic 為其做了私有化部署,而且 Anthropic 的推理與訓練本來就大比例跑在 Google Cloud 的 TPU 上,雙方有信任基礎;其他大廠則沒有這層關係,是真的把程式碼安全暫時擱在一邊,先把速度衝上去。
工程師的 token 花費,比工程師本人還貴
孟醒在 Palo Alto 走訪的數家 AI-native 新創公司中,一個工程師一年的 token 預算約為二十多萬美元,這個數字已經接近一個工程師的年薪。看似公司用 AI 裁人省錢,實際上總成本可能根本沒降,只是把人的成本換成了 token 成本。
Meta 把這件事推到極致,內部設立了一個 token 消耗排行榜,誰用得多誰上榜,末尾可能被裁,員工為此卷出了一個叫做「token legend」的非官方頭銜。但同一段時間,Meta 接連兩輪裁員、規模合計上萬人。一邊全員衝 token、一邊大規模裁員並不矛盾,這是同一件事的兩面。
孟醒實地看了一家 C 輪公司,技術負責人打開 Slack 給他看,全是 agent 在跑,背後並行十幾個 Cursor agent,再開一個 Claude Code 視窗負責調度。工程師圈最流行的焦慮,是睡覺前不知道我那十幾個 agent 要幹什麼,就很慌。
100 倍效率,沒有換來 100 倍營收
很多 CTO 興奮地告訴孟醒,「以前 60 個人花 1 年做的事,現在 2 個人加 Claude Code 一週就能搞定」,所謂「百倍工程師」、「十倍效率提升」。
但孟醒冷靜下來後問了一個問題:好,效率提升了 100 倍,那公司的營收增長 100 倍嗎?產品線擴張了 100 倍嗎?他沒有得到正面回答。事實是 100 倍的效率提升落到營收上,常常只體現了 50% 或一倍。差距在哪,現在沒人能說清楚。
「用了這麼多 token,公司應該基因突變成另外一種公司才對。但到底變成什麼,我也不知道。」一位創辦人這樣告訴他。連 Anthropic 自己也有跟不上的場景。孟醒問一位 Anthropic 朋友「你們自己用 agent 最痛苦的場景是什麼」,答案是 oncall 即時響應。
當 API 響應變慢、推理節點掛掉、用戶反饋輸出異常時,oncall 工程師需要快速定位是程式碼 bug、算力分配還是模型本身的問題。Anthropic 是全世界 coding agent 最強的公司,這個場景離他們的核心能力近得不能再近,他們內部的 oncall agent 仍然不好用。
蒸汽機跑得還沒馬車快,但沒人敢停下來等
孟醒形容當下的狀態:蒸汽機已經被發明出來,但有時候跑得還沒馬車快。關鍵是所有人都知道蒸汽機終將跑得更快,所以程式碼安全也不管了、token 預算爆了、排行榜卷起來了。至於蒸汽機什麼時候真的跑過馬車,沒人知道,但沒人敢停下來等那一天,因為停下來的代價,可能比燒錯 token 更大。
而 token 消耗大概率不是線性增長。孟醒援引研究機構 METR 的數據:衡量 AI agent 能以 50% 成功率完成多長任務(按人類專家完成時間算)的指標,2025 年 3 月時 Claude 3.7 Sonnet 還是 50 分鐘,到 2025 年底 Claude Opus 4.6 已經做到 14.5 小時。
過去兩年這個指標的翻倍週期,從 7 個月壓縮到 4 個月。一旦 agent 可靠性再上一個台階,token 消耗就不是每年加 50% 的問題,而是一夜之間上一個數量級。孟醒也提到一個朋友圈內共識的預測:到今年年底,不少公司(包括科技大廠)實際上只需要 20% 的人。
(回答一個問題:AI 讓你效率提升五倍,你要減少 80% 成本,還是做五倍的事?)
筆者今年 4 月曾在一篇文章中問過:當 AI 把一個團隊的生產力放大五倍,你可以減少八成人力維持原本產出,也可以維持人數做五倍的事。Aaron Levie 在 a16z Podcast 上提出,未來一間公司的 agent 數量可能是員工的 100 到 1,000 倍;黃仁勳則直言,如果世界沒有新的創意,AI 帶來的生產力提升最終只會轉化為失業。問題不在 AI,而在於決策者是否具備想像力。
孟醒這次矽谷的觀察,等於是在現場給出了答案的初稿:當 100 倍效率沒有換來 100 倍營收,當 token 預算逼近人力成本,當蒸汽機還跑不過馬車卻沒人敢停下,矽谷現在選的是「先把速度衝上去再說」。但這條路最終會走到「擴張能力」還是「壓縮成本」,目前沒有定論。
孟醒在文章結尾留下一個更平衡的視角:他這半個月看到那麼多「跟不上」確實讓人焦慮,但如果 AI 真的能在幾年內讓癌症變成慢性病、讓材料科學快進二十年,這場「跟不上」可能是人類發展史上最大的一次提速。
對企業決策者而言,真正的問題從來不是 AI 會不會取代人,而是當生產力被放大五倍、十倍、一百倍之後,你選擇用它去裁掉更多人,還是去做更多事。這個選擇,正在矽谷與全球企業的會議室裡同時發生。
這篇文章 用 AI 提升產出還是降低成本?百倍效率沒換來百倍營收,但矽谷沒人敢喊停 最早出現於 鏈新聞 ABMedia。
相關文章