AI 研究者 Aran Komatsuzaki 近日在 X 平台發布一項實驗分析，曝光主流大型語言模型 (LLM) 的分詞器 (tokenizer) 存在嚴重的「非英語語言稅 (non-English tax)」問題。其中 Anthropic 旗下 Claude 模型對中日韓語言的素材甚至需消耗高達將近三倍的 token，引發社群議論。

實驗方法：用一篇經典論文量化語言成本差距

Komatsuzaki 以經典文章《The Bitter Lesson》為素材，將其翻譯成中文、印地語、阿拉伯語、韓語、日語等多種語言，再分別送入各大模型的 tokenizer 計算 token 消耗數量。實驗以 OpenAI 英文版本為基準 (1.0×)，透過標準化倍率比較各模型對不同語言的處理效率。

Token 數量直接決定 API 使用費用與回應延遲，token 越多代表成本越高、速度越慢，因此 tokenizer 的效率差異，實際上就是使用者荷包與使用體驗的差距。

Komatsuzaki 也附上了他自己設計，能計算 token 用量的網站：

AI 也有種族歧視？Claude 語言稅最高，印地語首當其衝

OpenAI vs. Anthropic 逐語言 Token 消耗倍率長條圖

數據顯示，OpenAI 各語言的 token 倍率普遍控制在 1.4× 以內，而 Anthropic (Claude) 的差距則極為顯著：

印地語：3.24× (Claude) vs. 1.37× (OpenAI)

阿拉伯語：2.86× (Claude) vs. 1.31× (OpenAI)

俄語：2.04× (Claude) vs. 1.31× (OpenAI)

中文：1.71× (Claude) vs. 1.15× (OpenAI)

換言之，一名印度開發者若使用 Claude 的 API 處理印地語內容，實際支付的費用可能是同樣英文任務的三倍以上，且回應速度也會因 token 數膨脹而顯著下降。

六大模型橫向比較：中國本土模型反超、Gemini 表現最佳

六大模型跨語言 Token 消耗倍率熱力圖

Komatsuzaki 隨後發布的貼文進一步擴大比較範圍，納入 Gemini 3.1、Qwen 3.6、DeepSeek V4、Kimi K2.6 等模型，結果顯示：

Gemini 3.1：1.22× (對非英語用戶最友善)

Qwen 3.6：1.23×

OpenAI：1.33×

DeepSeek V4：1.49×

Kimi K2.6：1.76×

Anthropic：2.07× (對非英語用戶最不友善)

數據能看出，中文在 Qwen (0.85×)、DeepSeek (0.87×)、Kimi (0.81×) 上的 token 消耗則低於英文基準，顯示中國本土模型已針對中文進行深度優化。Komatsuzaki 本人則在回覆中坦言：「我沒想到 Claude 如此糟糕且不平衡。」

社群擔憂：「成本落差」是 AI 普及化過程的嚴重問題

實驗結果在 X 社群中引發強烈共鳴，許多非英語開發者表示，在實際使用中，相同的中文或韓文文件用 Claude 處理，費用確實遠高於 Gemini。

討論也延伸至技術根因：tokenizer 的效率差異主要源於訓練資料以英語內容及拉丁文字為主，導致模型對其他文字系統的理解程度較低，每個字元或詞彙需要消耗更多 token。即便全球印地語使用者多達數億人，但相對稀少的高品質訓練素材加上形態複雜的文字結構，使其成為 AI 使用成本最高的族群。

部分網友則認為，Anthropic 的主要客群偏向英語企業用戶與程式碼開發場景，因此對多語言優化缺乏動力，反觀 OpenAI 則較擅長處理語言內容，直言：「AI 本應是民主化的平等技術，但非英語使用者卻在為語言歧視買單。」

如今，這場圍繞 tokenizer 設計的爭議，已不只是技術問題，更反映出 AI 產業在全球擴張過程中的失衡。

這篇文章 Claude 會收語言稅？研究曝翻譯中日韓內容消耗最多近三倍 token 最早出現於鏈新聞 ABMedia。

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

LG CNS 第一季營業利潤因 AI 與雲端成長上升 19%

AI 行業動態

根據《朝鮮日報》，LG CNS 於 4 月 30 日表示，第一季度營業利潤年增 19.4% 至 942 億韓元（64.1 百萬美元），受惠於 AI 與雲端需求。營收成長 8.6% 至 1.3 兆韓元（894 百萬美元）。該公司的 AI 與雲端部門產生了 765.4 billi

GateNews15分鐘前

OpenAI 推 GPT-5.5-Cyber：對戰 Anthropic Mythos

AI 行業動態

OpenAI 公告推出 GPT-5.5-Cyber，專為網安設計，將在「未來幾天內」以政府協作的可信存取機制部署給關鍵防禦單位，非開放銷售。與 Anthropic Mythos 的開放路徑形成對照，白宮反對擴至70家。Preparedness Framework 評為 High（未到 critical），同時加強資安防護。後續觀察部署名單、CISA 可能入列與雙方資安標準分野。

鏈新聞abmedia49分鐘前

施耐德電氣 2025 年 Q1 營收達到 98 億歐元，受 AI 資料中心需求推動成長 11.2%

股票 AI 行業動態

根據路透社，施耐德電氣（Schneider Electric）在 4 月 30 日公布第一季營收為 98 億歐元（114 億美元），隨著 AI 資料中心需求推升，旗下有機成長提升至 11.2%。這家法國電力與散熱設備供應商表示，該結果略高於市場一致預期，並且

GateNews56分鐘前

Protum 為 AI 治理平台籌集 200 萬美元種子輪融資，目標於 2026 年 6 月完成交易

AI 行業動態

根據 TechCrunch Startup Spotlight，AI 治理新創 Protum 正在進行 200 萬美元的種子輪募資，目標在 2026 年 6 月前完成。由 Sandeep J. 創立，他具備 25 年的企業轉型經驗；Protum 提供一個平台，旨在讓企業能夠持續

GateNews1小時前

企業裁員潮恐致勞資雙輸局面，研究建議：應開徵 AI 自動化稅

AI 行業動態

研究指出AI裁員的需求外部性：裁員成本由企業獨享，但消費力道的損失卻由整體市場承擔，裁越多、需求越萎縮，雙方皆輸。提出徵收AI自動化稅，將外部成本內部化，並以稅收資助再培訓，以恢復需求並穩定經濟。

鏈新聞abmedia1小時前

Microsoft 的 AI 事業規模翻倍至 $370B ARR；計劃在 2026 年投入 $190B Capex

股票 AI 行業動態

在 4 月 29 日，Microsoft 報告了截至 3 月 31 日止期間的 2026 財年第三季業績，表現優於市場預期。Q3 營收達到 828.86 億美元，較去年同期成長 18%，且高於預期的 814 億美元；GAAP 淨利成長 23% 至 317.78 億美元；非 GAAP 稀釋每股盈餘 per diluted earnings per

GateNews1小時前

留言

0/400

暫無留言