Gate News 消息,3 月 18 日,人工智能公司 Sahara AI 宣布與微軟合作,為微軟提供高精度標註數據,共同推出開源基準 MATHVISTA。該基準專為測試 GPT-4V、Claude、Gemini 等模型在真實場景下的推理與決策能力,目前歷史下載量已超 27 萬次。這類高品質標註數據是 AI Agent 具備可靠推理與決策能力的基礎,直接影響數百萬用戶每日使用的 agent 表現。目前微軟、亞馬遜、Snap 及麻省理工學院(MIT)等機構均已採用 Sahara AI 的數據服務與 Agentic AI 解決方案。