Google 剛剛把全球最受歡迎的瀏覽器武器化了。 週三,這家搜尋巨頭宣布將 Gemini 3 直接整合進 Chrome,新增代理式瀏覽功能,讓 AI 代為處理多步驟任務——訂機票、比較產品、填寫表單,以及代理式瀏覽器已經能完成的所有功能。 此舉正值 Chrome 65% 的市佔率正面臨其他已在愛好者中定位的 AI 公司壓力之際。 主要功能是「自動瀏覽」,在美國提供給 Google AI Pro(每月 20 美元)和 AI Ultra(每月 250 美元)訂閱者使用。它類似 OpenAI 的「代理模式」,基本上讓瀏覽器自己的 AI 代理像人類一樣使用瀏覽器,而非依賴 API。
告訴 Gemini 在 Redfin 上尋找寵物友善公寓,或在多個旅遊網站上規劃家庭度假,它會點擊頁面、篩選結果,並將商品加入購物車——只有在購買或社群媒體貼文等敏感操作前才會暫停。
AI 存在於持續存在的側邊面板中,在你工作時維持分頁間的上下文。同時包含:Nano Banana 可即時生成影像,並整合 Gmail、行事曆、YouTube 和地圖的 Connected Apps。而這或許正是 Chrome 與競爭對手區隔開來的關鍵:驅動瀏覽器的強大 AI 模型。 Personal Intelligence 預計在未來幾個月內推出,讓 Chrome 能記住過去的對話,做出量身打造的回應。當然,這將是自願加入的功能——Google 就是吃了這個教訓。
代理型瀏覽器競賽正迅速升溫。OpenAI 於十月推出的 Atlas,讓 ChatGPT 能為 Plus、Pro 和 Business 用戶自主瀏覽網頁。Perplexity 的 Comet 瀏覽器和 Anthropic 的 Claude for Chrome 擴充功能也遵循類似的策略。其他較少人知的選項包括 Opera Neon、Norton 的 NEO 瀏覽器,以及由 The Browser Company 在停產熱門 Arc 瀏覽器後開發的具爭議性的 Dia 瀏覽器。
甚至像 BrowserOS 這樣的開源專案也加入戰局,提供以隱私為先的替代方案,利用你自己的 API 金鑰在本地運行 AI 代理。 每個領域都有其獨特性。Atlas 在對話式搜尋方面表現出色,ChatGPT 側邊欄能自動理解螢幕上的內容。Claude for Chrome 是由 Anthropic 開發的擴充套件,採用不同的方式,並以 Claude 驅動的代理功能來強化 Chrome。Perplexity 的 Comet 將網頁搜尋直接整合進高速的瀏覽功能。Opera 的 Neon 著重隱私功能。 Chrome 的優勢是什麼?你大概已經在用了。無需下載,工作流程不會中斷,Google 的生態系統透過 Workspace、行事曆和相片緊密連結。該公司押注便利性勝過新奇——大多數人不會在現有瀏覽器變得更聰明時換成 AI。 但代理性瀏覽引入了新的攻擊途徑。Google 承認「主要新威脅」是間接提示注入——惡意網站在程式碼中隱藏指令,誘使 AI 竊取資料或發起交易。資安研究人員在 Perplexity 的彗星中也發現了類似的漏洞,但這些漏洞很快就被修補了。 Google 的分層防禦包括一個獨立的「用戶對齊批評者」模型,會對每一項擬議行動進行雙重核對,並針對敏感網站清單進行確定性檢查,並在財務行動前取得用戶確認。AI 無法直接存取密碼(它會向 Google 密碼管理器請求許可)、無法下載檔案,也無法執行程式碼。原產地隔離防止牠游移到無關地點。
還是有風險嗎?絕對是。Google 透過其漏洞獎勵計畫,提供最高 20,000 美元的獎勵,任何能繞過這些防護措施的人都能獲得——這是對沒有萬無一失的承認。 這家科技巨頭也在推動通用商務協議(Universal Commerce Protocol),這是與 Shopify、Etsy、Wayfair 和 Target 共同開發的開放標準,旨在讓 AI 代理人能無縫交易。如果這股趨勢成功,可能會以 AI 中介為核心,取代直接瀏覽,重塑電子商務格局——這將顛覆我們所知的數位廣告。 目前自動瀏覽仍僅限美國,訂閱者門檻,並明確標示為預覽軟體。Google 正在逐步推行,收集回饋後再大規模部署。Windows、iOS 和 Android 版本也會推出,但目前還沒有時間表。