首页 行业动态 AI下一个奇点出现?可能和你我都切身相关

AI下一个奇点出现?可能和你我都切身相关

2025.06.30


    6月25日,谷歌发布Gemini Robotics On-Device,这是谷歌DeepMind首个可以直接部署在机器人上的VLA(视觉-语言-动作)模型,可以帮助机器人更快、更高效地适应新任务和环境,同时无需持续的互联网连接。它的应用范围广泛,涵盖人形机器人和工业机器人等多个领域,为未来机器人智能化发展提供了全新可能,不仅是AI的一次落地,更可能预示着下一轮人机关系的根本性重构。


    同时,谷歌还推出Gemini Robotics SDK,帮助开发者评估Gemini Robotics在设备上的性能,包括在MuJoCo物理模拟器中进行测试,开发者只需50-100个演示即可完成模型评估,让机器人学习新技能。




    Gemini Robotics On-Device属于Gemini Robotics系列,该模型于今年三月发布,是当时最强的VLA模型,其基础模型是具备多模态推理能力的Gemini 2.0。Gemini Robotics On-Device是Gemini Robotics经过优化的版本,也是谷歌首个可供微调的VLA模型。顾名思义,On-Device指的是,所有决策和感知计算可以完全在设备本地完成,无需借助云端。这一技术突破不仅提升了机器人的自主性,还显著增强了其环境适应能力。


    据介绍,Gemini Robotics On-Device是用于双臂机器人的基础模型,其设计目标是最大限度地减少计算资源需求。在展示视频中,Gemini Robotics On-Device表现出了强大的通用灵活性和任务泛化能力,它针对快速运行灵巧操作实验而设计,可通过微调来提升性能,从而适应新任务;经过优化,可在本地运行并实现低延迟推理。这意味着机器人具备了近似人类本能反应的操作能力,更适合在现实环境中与人协作。




    DeepMind进行了不少视觉、语义和行为泛化能力实验,整体来看,Gemini Robotics On-Device在这些广泛的测试场景中表现强大。它能够遵循自然语言指令去完成复杂任务,例如“清理桌面”“找到我女儿最喜欢的玩具”等等,不仅识别语义,还能理解空间、识别物品、规划路径。在面对陌生物体时,机器人可以通过视觉识别提取特征,并结合语言指令进行语义解析,最终生成精准的操作路径,实现“感知-理解-行动”的无缝衔接。


    DeepMind还研究了让Gemini Robotics On-Device模型适应不同的机器人。训练时,他们采用的是ALOHA机器人,但实验表明能够进一步将模型调整用于双臂Franka FR3机器人和Apptronik的Apollo人形机器人。





    在双臂机器人Franka上,该模型可以执行通用指令,包括处理之前未见过的物体和场景、完成诸如折叠连衣裙之类的灵巧任务,或执行需要精准度和灵活性的工业皮带装配任务。


    Apollo人形机器人则是完全不同的机器人形态,该模型也能相当好地适应。同一个通用模型可以遵循自然语言指令,并以通用方式操控不同的物体,包括之前未见过的物体。




    更值得一提的是,该模型还支持边缘设备的轻量化运行,即便是资源受限的小型机器人也能实现高效智能操作。例如,在灾难救援或极端环境下,配备Gemini模型的移动机器人可以在无网络连接的情况下独立完成搜索、识别与操作任务,极大拓展了机器人的应用边界。这种跨平台、跨场景的灵活性,使Gemini成为推动机器人普及化与智能化的重要技术支撑。


    不依赖云端,确保数据本地处理,恰是Gemini Robotics On-Device的革命性意义。这不仅降低延迟,在网络不稳定或者无网络环境中也适用,而且给用户吃了颗“隐私安全”的定心丸。在家庭、医疗、工业这样对数据封闭性要求较高的情景里,机器人从“能运行”升级到“可信赖”。


    以往的AI专注于语言、图像等静态任务,GPT、Claude等系统虽然强大,但都无法动手。而Gemini Robotics代表了一种全新的认知-行动统一模型,AI从“脑”到“手”,实现了大模型与物理世界交互的根本突破。





    我们现在已经可以畅想,当这类技术落地到家政、养老、教育、零售、甚至灾难救援等等场景,将带来多少便利与颠覆。


    对你我这样的普通人来说,它可以成为家庭生活的深度陪伴者,一个升级版的“智能音箱+家庭管家+机械助手”,它会记住孩子的喜好、老人的用药时间、我们的早晚生活习惯等等。毋庸讳言,老龄社会将至,照护压力沉重。这种机器人能帮助起身、监测摔倒、语音沟通、情绪安抚,将会是未来生活的重要生产力。


    Gemini机器人还能作为特殊教育、康复训练、心理疏导的辅助工具,尤其对孤独症儿童、语言障碍者等人群极具价值。具身智能带来的温柔与稳定,正是特殊人群教育和康复领域长久以来缺乏的“陪伴型支持”。在不替代专业人员的前提下,它可能成为更友善、更持续、更定制的辅助存在。







    就像一个网友感叹的那样,Gemini Robotics On-Device正在成为“机器人版的安卓”。安卓系统的出现,让手机厂商摆脱了自研系统的负担,直接催生了移动互联网的生态繁荣。Gemini Robotics On-Device也具备类同的意义,它是可运行在各种机器人体型上的通用智能平台,只要硬件满足基本算力,它就能用Gemini模型来控制识别、规划、执行等能力。换句话说,安卓统一了手机的“大脑”,Gemini也正在尝试统一机器人的“大脑”。此外,安卓改变了人机交互的方式,让手机变得像电脑,而Gemini Robotics的目标正是进一步让AI变得“具身”,让机器人成为人类真正的助手。


    Gemini Robotics On-Device所代表的不只是一次科技突破,它更像是一个时代的预演。我们离真正的具身智能时代又近了一步,人类将第一次面对一种既能听懂你、又能帮你干活的智能个体。未来的AI,不只是让你多知道一些,更是让你少做一些,甚至帮你做得更好,这也许就是AI最终的理想落点。





    畅想未来很爽,但细观眼下,Gemini Robotics仍存在几大技术门槛。首先是稳定性与安全性,AI是否足够稳健,会不会做出危险动作?这仍需进行大量测试。人们是否真的放心把现实任务交给机器人,也是我们需要迈过的心理门槛。其次是能耗与成本问题。本地运行大模型要求芯片、硬件同时进步,相比“动嘴不动手”的语言模型,机器人需要长时间驱动视觉感知系统、运算中枢、机械执行组件,这对电池续航、散热系统、以及芯片能效提出了远高于传统AI的要求。另一个不可忽视的因素就是伦理与监管问题。具身智能机器人能实现“感知-决策-行动”的闭环,若它在行动中伤人毁物,责任由谁来承担?长期陪伴中,它有可能引发情感依赖、人格投射等问题,又该如何处理?此外数据的归属保护、机器人的自主性边界设定,这些都是前方未解之问。当具身智能令AI从信息空间进入物理现实,随之而来的不只是技术自由,更有治理责任。




相关链接:中国区支持的其他支付方式名单

shopify的套餐费用明细



在线留言 在线留言
如果您对我们的产品感兴趣并想了解更多详情,请在此留言,我们会尽快回复您。