Google 推出 Gemini Robotics ER 1.6:SOTA 机器人模型,擅长视觉与空间推理

鏈新聞abmedia

Google DeepMind 发布了全新的机器人基础模型 Gemini Robotics ER 1.6,其中 ER 代表 Embodied Reasoning(具身推理)。该模型在视觉与空间推理方面达到了当前最佳水平(SOTA),并已通过 Gemini API 开放使用。Google AI 开发者关系负责人 Logan Kilpatrick 在社交媒体上公布了这项消息。(来源)

什么是 Embodied Reasoning?

Embodied Reasoning 是指 AI 模型理解并推理物理世界的能力。与传统的语言模型不同,具身推理模型需要处理三维空间中的物体位置、形状、材质与物理交互关系。Gemini Robotics ER 1.6 专门针对这类任务进行优化,使机器人能够更准确地理解周围环境并做出适当的动作决策。

核心能力

Gemini Robotics ER 1.6 的主要优势集中在两个方面:

能力 说明 视觉推理 能够从影像与视频中识别物体、理解场景结构,并据此进行决策 空间推理 理解三维空间中物体的相对位置、距离与方向,支持复杂的操作规划

这两项能力的结合让机器人能够处理更复杂的现实世界任务。例如,在仓储环境中,机器人需要同时识别不同形状的物品,并计算最佳的抓取角度与放置位置——这正是 Gemini Robotics ER 1.6 所擅长的场景。

通过 Gemini API 使用

与过去许多仅停留在论文阶段的机器人模型不同,Gemini Robotics ER 1.6 已经通过 Gemini API 提供访问。这意味着开发者与硬件厂商可以直接将这款模型整合到自己的机器人系统中,无需从零开始训练模型。

API 的开放也降低了机器人 AI 的开发门槛。过去,要开发一套具备视觉与空间推理能力的机器人系统需要大量的数据收集与模型训练工作。现在,开发者可以专注于硬件设计与应用场景的开发上,把底层的推理能力交给 Gemini Robotics ER 1.6 来处理。

Google 的机器人 AI 布局

Gemini Robotics ER 1.6 是 Google DeepMind 在机器人领域的最新成果。从早期的 RT-2 到现在的 Gemini Robotics 系列,Google 持续将大型语言模型的能力延伸到物理世界的交互中。ER 1.6 版本在前代基础上进一步提升了推理精度,尤其在需要精细操作的场景中表现更为出色。

随着机器人产业进入新一轮成长期,具备强大视觉与空间推理能力的基础模型将成为关键基础设施。想了解更多 Gemini 生态系统的发展,可以参考 Gemini 完整指南。

这篇文章 Google 推出 Gemini Robotics ER 1.6:SOTA 机器人模型,擅长视觉与空间推理 最早出现在 链新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenAI 的 Greg Brockman:AI 正从聊天转向自主任务执行

Gate 新闻消息,4月27日——OpenAI 总裁兼联合创始人 Greg Brockman 表示,新一轮人工智能将把用户从与 AI 机器人聊天,转向指派现实世界的任务。 这种转变要求企业重新思考运营工作流程,并为安保、管理与成本建立新的协议,为

GateNews22 分钟前

B.AI 升级基础设施,推出重磅技能功能

Gate News 消息,4月27日——B.AI 本周宣布多项产品与生态进展。本周,BAIclaw 落地页获得了全面的视觉与交互改版,并将网站多语言支持扩展至 10 种语言,进一步增强其全球可用性。 在基础设施方面

GateNews36 分钟前

北京拋禁令要求撤銷交易!Meta 砸 20 億美元收購中國 AI 新創 Manus 落空

中国国家发展改革委今(4 月 27 日)正式发布公告,外商投资安全审查工作机制办公室“依法依规对外资收购 Manus 项目作出禁止投资决定,要求当事人撤销该收购交易”。这是中国《外商投资安全审查办法》施行以来,少数动用最高强度处置“禁止投资”并要求撤销既成交易的案例。 Meta 砸 20 亿美元,买进最便宜的 AI 应用 时间回到 2025 年 12 月 29 日。Meta 宣布收购中国 AI 代理新创 Manus,市场预估价格落在 20 至 30 亿美元之间。Manus 是北京蝴蝶效应科技开发的通用型 AI,2025 年 3 月 6 日上线后因 GAIA benchmark 表现亮眼一夜

鏈新聞abmedia50 分钟前

智己科技-P IPO股份在灰市上飙升逾360%,涨幅收窄至320%

Gate 新闻消息,4月27日——(01879.HK),一家在香港上市的AI芯片公司——智己科技-P(Xizhi Technology-P)的股价在今天早些时候的灰市 (dark market) 上暴涨逾360%,尽管此后涨幅已收窄至320%。 该股票正在等待其官方香港IPO上市

GateNews1小时前
评论
0/400
暂无评论