Google DeepMind 发布了全新的机器人基础模型 Gemini Robotics ER 1.6,其中 ER 代表 Embodied Reasoning(具身推理)。该模型在视觉与空间推理方面达到了当前最佳水平(SOTA),并已通过 Gemini API 开放使用。Google AI 开发者关系负责人 Logan Kilpatrick 在社交媒体上公布了这项消息。(来源)
什么是 Embodied Reasoning?
Embodied Reasoning 是指 AI 模型理解并推理物理世界的能力。与传统的语言模型不同,具身推理模型需要处理三维空间中的物体位置、形状、材质与物理交互关系。Gemini Robotics ER 1.6 专门针对这类任务进行优化,使机器人能够更准确地理解周围环境并做出适当的动作决策。
核心能力
Gemini Robotics ER 1.6 的主要优势集中在两个方面:
能力 说明 视觉推理 能够从影像与视频中识别物体、理解场景结构,并据此进行决策 空间推理 理解三维空间中物体的相对位置、距离与方向,支持复杂的操作规划
这两项能力的结合让机器人能够处理更复杂的现实世界任务。例如,在仓储环境中,机器人需要同时识别不同形状的物品,并计算最佳的抓取角度与放置位置——这正是 Gemini Robotics ER 1.6 所擅长的场景。
通过 Gemini API 使用
与过去许多仅停留在论文阶段的机器人模型不同,Gemini Robotics ER 1.6 已经通过 Gemini API 提供访问。这意味着开发者与硬件厂商可以直接将这款模型整合到自己的机器人系统中,无需从零开始训练模型。
API 的开放也降低了机器人 AI 的开发门槛。过去,要开发一套具备视觉与空间推理能力的机器人系统需要大量的数据收集与模型训练工作。现在,开发者可以专注于硬件设计与应用场景的开发上,把底层的推理能力交给 Gemini Robotics ER 1.6 来处理。
Google 的机器人 AI 布局
Gemini Robotics ER 1.6 是 Google DeepMind 在机器人领域的最新成果。从早期的 RT-2 到现在的 Gemini Robotics 系列,Google 持续将大型语言模型的能力延伸到物理世界的交互中。ER 1.6 版本在前代基础上进一步提升了推理精度,尤其在需要精细操作的场景中表现更为出色。
随着机器人产业进入新一轮成长期,具备强大视觉与空间推理能力的基础模型将成为关键基础设施。想了解更多 Gemini 生态系统的发展,可以参考 Gemini 完整指南。
这篇文章 Google 推出 Gemini Robotics ER 1.6:SOTA 机器人模型,擅长视觉与空间推理 最早出现在 链新闻 ABMedia。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
英特尔股价飙升 110%,AI 转型重塑科技行业
Gate News 消息,4月27日——英特尔(Intel)的股价今年已上涨 110%,并在周五创下新的历史最高收盘价,标志着这家芯片制造商在上一次高点之后 25 年的重大转折。反弹反映了科技行业更广泛的转型:在这一过程中,AI 转型正在制造势均力敌的胜者与败者——构建 AI 基础设施的硬件公司正在蓬勃发展,而软件与服务公司面临日益加剧的压力。
在标普 500 指数(S&P 500)的信息技术板块中,该板块年初至今上涨 8%,硬件与软件之间出现了急剧分化。像 Applied Materials 和 Lam Research 这样的半导体设备制造商累计飙升约 63%,而包括 Accenture、IBM 和 Cognizant 在内的 IT 咨询公司下跌了将近 28%。这一格局反映了经典的“创造性破坏”周期:创新一方面催生新产业,另一方面又会扰乱既有格局——这种动态此前曾分别以 PC 重塑大型机、以及以移动设备重塑 PC。
英特尔的机会源于不断演变的 AI 基础设施需求。像 Nvidia 这样的 GPU 生产商在最初的繁荣中领跑,因为企业需要图形处理器来训练 AI 模型。随后,这一需求扩展至内存芯片制造商、电力公司以及数据存储厂商。如今,英特尔制造的 CPU——中央处理器——正变得对日常 AI 推理与部署至关重要。“CPU 正重新插入,成为 AI 时代不可或缺的基础,”英特尔首席执行官 Lip-Bu Tan 在周五的公司投资者电话会议上表示。
不过,技术转型初期的赢家并不总能持续胜出。电信公司在互联网时代充当了“淘金者”(picks-and-shovels),但未能维持其涨势。相反,微软通过云计算从 PC 时代的下滑中恢复过来,而苹果则从 PC 转向,打造移动时代。正如分析师 Ed Yardeni 所指出的,“要么你创造,要么你就被摧毁”——也强调了即便是当下的领跑者,结局依然充满不确定性。
GateNews9 分钟前
蚂蚁集团推出 Ling-2.6-1T:万亿参数模型,针对词元高效的任务执行进行了优化
Gate 新闻消息,4月27日——蚂蚁集团的 inclusionAI 已发布 Ling-2.6-1T,这是一款 Ling 系列中的新一代万亿参数旗舰指令模型。与长链推理模型不同,Ling-2.6-1T 采用“快速思考”机制,旨在以最少的 词元消耗实现对任务的精确执行
GateNews21 分钟前
Silicon Valley Tech Executives Boost Security Details After Recent Attacks on Altman, Others
Gate 新闻消息,4月27日——在近期针对知名科技领袖的袭击之后,包括对 Sam Altman 位于旧金山的住所以及 UnitedHealthcare CEO 的袭击,硅谷高管正在显著升级个人安保措施。日益高涨的反AI情绪,叠加这些备受关注的事件,促使科技创始人重新评估私人安保安排:从此前不愿雇用保镖,转向将全面保护视为标准做法。
安保风险既来自线下抗议,也来自线上威胁。根据安保专业人士的说法,社交媒体可以在数天内迅速将公众的不满集中指向特定个人;而公开分享的照片、行程和位置等信息,会形成可被利用的漏洞。科技高管所面临的威胁范围,从人身保护和住宅安防,延伸到出行风险评估以及线上威胁监测。
企业披露反映了这一趋势。根据 Equilar 对 S&P 500 代理声明的分析,2025 年有 37.8% 的公司为至少部分高管提供安保福利,高于 2024 年的 33.5%。在提供此类福利的公司中,中位数安保支出从 $108,700 增至 $130,500。Meta 在 2026 年的代理文件中披露,由于 Mark Zuckerberg 备受关注且面临特定安保威胁,公司为他提供了全面的安保安排:2025 年用于住宅与个人出行安保的支出约为 $8.50 million,另有一笔额外的 百万(税前)安保津贴。私人安保公司也在调整服务模式:从传统的穿西装、佩戴耳机的保镖,转向能够融入高管董事会议室、晚宴以及家庭场景的人员。
GateNews57 分钟前
Meta 为 AI 数据中心预留 1GW 空间太阳能电力容量
Gate 新闻消息,4月27日——Meta 宣布与 Overview Energy 和 Noon Energy 建立合作伙伴关系,以为其 AI 数据中心获取可再生电力。该公司已通过 Overview Energy 预留最多 1GW 的空间太阳能电力容量,并通过 Noon Energy 预留最多 1GW/100GWh 的超长时长储能能力
GateNews1小时前
Moonshot AI 的 Kimi K3 将在 2026 年第三季度推出:测试中拥有 2.5T+ 参数和 1M 个 tokens 上下文
Gate News 消息,4 月 27 日——据报道,Moonshot AI 计划在 2026 年第三季度 ( 年 7 月-9 月) 推出 Kimi K3。该模型将拥有超过 2.5 万亿个参数,内部测试显示其上下文窗口能力超过 100 万个 tokens。
然而,1M 上下文是否会
GateNews1小时前
OpenAI 的 Greg Brockman:AI 正从聊天转向自主任务执行
Gate 新闻消息,4月27日——OpenAI 总裁兼联合创始人 Greg Brockman 表示,新一轮人工智能将把用户从与 AI 机器人聊天,转向指派现实世界的任务。 这种转变要求企业重新思考运营工作流程,并为安保、管理与成本建立新的协议,为
GateNews1小时前