AI 並非魔法,也沒有簡單到「寫個 AI 程式、就能自動搞定一切、坐等獲利」的程度。其實,大多數人並不真正了解 AI 究竟是什麼。
那些真正明白的人(不到 5%)嘗試自行搭建,結果往往失敗。智能體會出現「幻覺」、在任務進行中途忘記自己做到哪一步,或是在不該呼叫工具時誤用工具。展示時一切順利,一進入正式環境就立刻崩潰。
我部署 AI 程式已超過一年。我的軟體職涯始於 Meta,但半年前我離職創立新公司,專為企業部署可在生產環境運作的 AI 智能體。如今,我們的年經常性收入已達 300 萬美元,且持續成長。這並非我們比他人聰明,而是靠著不斷試錯、歷經多次失敗,終於摸索出成功的公式。
以下是我在打造真正可用智能體過程中的所有經驗。不論你是初學者、專家,還是介於兩者之間,這些心得都值得參考。
這聽起來也許很顯而易見,你或許也早已聽過。但正因為它如此重要,才值得反覆強調。許多人以為打造智能體就是把各種工具串起來:挑個模型、開放資料庫權限,然後就可以放著不管。這種作法會立刻失敗,原因有幾個:
智能體不知道重點是什麼。它不知道五步前發生了什麼,只能看到當前這一步,然後猜接下來該怎麼做(而且常常猜錯),最後只能碰運氣。
語境,往往是價值百萬的智能體與毫無價值的智能體之間最根本的差異。你必須特別關注並優化以下幾個面向:
智能體記得什麼:不只是當前任務,還包括導致現狀的完整歷史。例如處理發票異常時,智能體需要知道:異常是如何觸發的、原始發票是誰送出的、適用哪條政策、這個供應商上次出問題是怎麼處理的。沒有這些歷史,智能體只能亂猜,這比沒有智能體還糟。因為如果靠人處理,問題早就解決了。這也解釋為什麼有人抱怨「AI 很難用」。
資訊如何流動:當你有多個智能體,或一個智能體處理多步流程時,資訊必須在各階段間精確傳遞,不能遺失、損壞或被誤解。負責分類請求的智能體,必須將乾淨、結構化的語境傳給負責解決問題的智能體。如果交接不嚴謹,下游全亂。這代表每個環節都要有可驗證的結構化輸入與輸出。例如 Claude Code 的 /compact 功能,就能在不同 LLM 對話間傳遞上下文。
智能體對業務領域的理解:處理法律合約審查的智能體,必須清楚哪些條款關鍵、風險評估、公司實際政策為何。你不能只丟給它一堆文件,就期待它自己領悟重點,這是你的責任。而你的責任也包括:以結構化方式為智能體提供資源,讓它真正具備領域知識。
糟糕的語境管理表現為:智能體因為忘記已獲得的答案而重複呼叫同一工具;或因收到錯誤資訊而呼叫錯誤工具;又或者做出與前幾步矛盾的決策;甚至每次都把任務當全新來處理,無視過往類似任務中明顯的模式。
良好的語境管理則讓智能體像一位經驗豐富的業務專家:它能在不同資訊間建立連結,無需你明確告訴它這些資訊有什麼關聯。
語境,是區分「只能做展示」的智能體和「真正能在生產環境運作並交付成果」的智能體的關鍵。
錯誤看法:「有了它,我們就不用招人了。」
正確看法:「有了它,三個人就能完成過去十五個人的工作。」
智能體終將取代部分人力勞動,不承認這點只是自欺欺人。但積極的一面是:智能體不會取代人類判斷,而是消除圍繞人類判斷產生的各種摩擦,例如查找資料、蒐集數據、交叉比對、格式整理、任務分派、跟進提醒等等。
舉例來說:財務團隊仍需針對異常情況做決策,但有了智能體,他們不再需要花 70% 的結帳週時間去翻找缺失單據,而是能用這 70% 的時間真正解決問題。智能體完成所有基礎工作,人類只做最終審核。根據我為客戶服務的經驗,實際情況是:企業並不會因此裁員。員工的工作內容會轉變,從繁瑣的手動操作轉向更有價值的任務,至少目前如此。當然,長遠來看,隨著 AI 進一步發展,這種情況可能會改變。
真正從智能體中獲益的公司,不是那些只想把人類踢出流程的,而是那些意識到:員工大部分時間花在「鋪陳性工作」上,而不是真正創造價值的部分。
用這個思路設計智能體,你就不用再執著於「準確率」:智能體做它擅長的,人類也專注於人類擅長的。
這也代表你能更快部署上線。不必讓智能體處理所有極端情況,只要它把常見情況處理好,並將複雜異常交給人類——同時附上足夠語境,讓人能快速解決。至少現階段應如此。
智能體如何在單一任務內以及跨任務保存資訊,決定了它能否規模化運作。
常見有三種模式:
獨立智能體:單獨處理完整工作流程,從頭到尾。這種最好搭建,因為所有語境都集中在一處。但流程一拉長,狀態管理就成挑戰:智能體必須記得第三步的決策,等執行到第十步還要用上。如果語境視窗滿了,或記憶結構不正確,後期決策就會缺乏早期資訊支撐,導致出錯。
並行智能體:同時處理同一問題的不同部分。速度更快,但引入協調問題:結果如何合併?如果兩個智能體得出矛盾結論怎麼辦?必須訂定明確的協議來整合資訊、解決衝突。通常需要引入一個「裁判」(人或另一個 LLM)來處理衝突或競態條件。
協作智能體:依序交接工作。智能體 A 分類,傳給 B 做研究,再傳給 C 執行解決方案。這種模式適用於有明確階段的工作流程,但交接環節最容易出問題。智能體 A 學到的內容,必須以智能體 B 能直接使用的格式傳遞下去。
多數人犯的錯是:把這些模式當作「實作方案」來看。實際上,它們是架構決策,直接決定你的智能體能力邊界。
例如你要打造一個處理銷售合約審核的智能體,就必須決定:要讓一個智能體全程負責?還是設計一個路由智能體,將任務分派給定價審核、法務審核、高階主管審核等不同專長的智能體?只有你最清楚背後的實際業務流程,也希望你終能把這些流程教給你的智能體。
怎麼選?取決於每個環節的複雜度、階段間需要傳遞多少語境,以及各環節是需要即時協同還是依序執行。
如果架構選錯,你可能得花幾個月去除錯一些根本不是 bug 的問題。那其實是你的設計、你要解決的問題以及你的解決方案之間的架構錯配。
做 AI 系統時,很多人的第一反應是:做個儀表板,把資訊展示出來,讓大家看到發生了什麼。拜託,真的別再做儀表板了。
儀表板沒什麼用。
你的財務團隊早就知道有單據缺失,銷售團隊也早就知道有些合約卡在法務那裡。
智能體應該在問題發生時直接攔截,並轉給對應的人處理,同時提供解決所需的一切資訊,立即執行。
發票來了但文件不齊?別只是記在報告裡。立即標記,搞清楚誰該補什麼資料,把問題連同完整語境(供應商、金額、適用政策、具體缺什麼)轉給他。並且阻止這筆交易入帳,直到問題解決。這步很關鍵,否則問題會在組織裡到處「滲漏」,你想補救都來不及。
合約審核超過 24 小時沒動靜?別等到週會再提。自動升級,附上交易詳情,讓審核人不用到處查系統就能快速決策。要有緊迫感。
供應商沒按時完成里程碑?別等誰發現。自動觸發應急預案,在有人意識到問題前就啟動應對流程。
你 AI 智能體的職責是:讓問題無法被忽視,且解決起來極其輕鬆。
要直接揭露問題,而不是透過儀表板間接顯示。
這和多數公司用 AI 的方式正好相反:他們用 AI 來「看見」問題,而你應該用 AI 來「逼著」解決問題,並且要快。等問題解決率接近 100% 了,再考慮要不要做個儀表板。
企業不斷購買沒人用的 SaaS 工具是有原因的。
SaaS 容易採購:有展示、有報價、需求清單上有個勾可以打。有人核准,就覺得事情推進了(但往往並非如此)。
買 AI SaaS 最糟的是,它往往就擺在那裡。它沒有融入實際工作流程,成了又一個需要登入的系統。你被迫遷移資料,一個月後它只是又多了一個要管理的供應商。12 個月後它被棄用,但你卻甩不掉,因為切換成本太高,結果就是「技術債」。
基於現有系統客製化的 AI 智能體就能避免這類問題。
它在你已經使用的工具裡運作,不創造新的工作平台,反而讓現有工作更快完成。智能體處理任務,人類只看結果。
真正的成本比較不是「開發費 vs 授權費」,而是更簡單的邏輯:
SaaS 累積「技術債」:每買一個工具,就多一個要維護的整合、一個遲早會過時的系統、一個可能被收購 / 轉型 / 關閉的供應商。
自建智能體累積「能力」:每次改進都讓系統更聰明,每個新工作流程都擴展了可能性。投資是複利成長,不會隨時間貶值。
所以我過去一年一直說:通用 AI SaaS 沒有未來。產業數據也在印證:多數採購 AI SaaS 的企業在 6 個月內停用,且完全沒看到生產力提升。真正從 AI 獲益的,都是那些擁有客製化智能體的公司,無論是自行開發還是委託第三方開發。
這就是為什麼早期掌握智能體的公司會擁有長期結構性優勢:他們在建設會越來越強的基礎設施。其他人只是在租用遲早要淘汰的工具。在這個每月都劇變的領域,每浪費一週,對你的產品路線圖和整體業務都是重大損失。
如果你的 AI 智能體專案規劃一年才能上線,那已經輸了。
計畫趕不上變化。你設計的工作流程很可能不符合實際工作方式,而你沒想到的邊緣情境往往最重要。12 個月後 AI 領域可能天翻地覆,你做的早已過時。
最多 3 個月,必須進入生產環境。
在這個資訊爆炸時代,真正的能力在於:知道如何有效運用資訊,並與之協作而非對抗。要實際做事:處理真實任務、做出真實決策、留下可追溯的紀錄。
我見過最常見的問題是:內部開發團隊常把本該 3 個月完成的 AI 專案估成 6–12 個月。或更糟——嘴上說 3 個月,開工後卻用各種「意外原因」不斷延誤。這不全怪他們,AI 領域確實複雜。
所以你需要真正懂 AI 的工程師:他們了解 AI 如何規模化運作、見過真實場景中的問題、清楚 AI 的能力與限制。現在太多「半吊子」開發者,以為 AI 什麼都能做——這離事實太遠。如果你是一名想進入企業級應用 AI 領域的軟體工程師,你必須扎實掌握 AI 的實際能力邊界。
打造可用的智能體,關鍵在這幾點:
語境決定一切:沒有好上下文的智能體只是昂貴的隨機數產生器。務必做好資訊流轉、記憶持久化、領域知識嵌入。以前大家笑「提示詞工程師」,現在「上下文工程師」就是它的 2.0 版。
為「增效」設計,而非「取代」:讓人做擅長的事,讓智能體清理路障,使人更專注。
架構比模型選擇更重要:用獨立、並行還是協作智能體,這個決策比選哪個模型重要得多。先把架構設計對。
攔截並解決,而非報告與回顧:儀表板是問題的「墳墓」。要建立能逼著問題被快速解決的系統。
快速上線,持續迭代:最好的智能體是已在生產環境運作並持續改進的那個,而不是還在設計階段的那個。(並且要緊盯你的時程)
其他都是細節。
技術已經就緒,但你可能還沒準備好。
搞懂這一點,你就能把業務規模擴大 100 倍。





