AI下一个奇点出现？可能和你我都切身相关-www.dyyshopify.com

首页行业动态 AI下一个奇点出现？可能和你我都切身相关

AI下一个奇点出现？可能和你我都切身相关

2025.06.30

6月25日，谷歌发布Gemini Robotics On-Device，这是谷歌DeepMind首个可以直接部署在机器人上的VLA（视觉-语言-动作）模型，可以帮助机器人更快、更高效地适应新任务和环境，同时无需持续的互联网连接。它的应用范围广泛，涵盖人形机器人和工业机器人等多个领域，为未来机器人智能化发展提供了全新可能，不仅是AI的一次落地，更可能预示着下一轮人机关系的根本性重构。

同时，谷歌还推出Gemini Robotics SDK，帮助开发者评估Gemini Robotics在设备上的性能，包括在MuJoCo物理模拟器中进行测试，开发者只需50-100个演示即可完成模型评估，让机器人学习新技能。

Gemini Robotics On-Device属于Gemini Robotics系列，该模型于今年三月发布，是当时最强的VLA模型，其基础模型是具备多模态推理能力的Gemini 2.0。Gemini Robotics On-Device是Gemini Robotics经过优化的版本，也是谷歌首个可供微调的VLA模型。顾名思义，On-Device指的是，所有决策和感知计算可以完全在设备本地完成，无需借助云端。这一技术突破不仅提升了机器人的自主性，还显著增强了其环境适应能力。

据介绍，Gemini Robotics On-Device是用于双臂机器人的基础模型，其设计目标是最大限度地减少计算资源需求。在展示视频中，Gemini Robotics On-Device表现出了强大的通用灵活性和任务泛化能力，它针对快速运行灵巧操作实验而设计，可通过微调来提升性能，从而适应新任务；经过优化，可在本地运行并实现低延迟推理。这意味着机器人具备了近似人类本能反应的操作能力，更适合在现实环境中与人协作。

DeepMind进行了不少视觉、语义和行为泛化能力实验，整体来看，Gemini Robotics On-Device在这些广泛的测试场景中表现强大。它能够遵循自然语言指令去完成复杂任务，例如“清理桌面”“找到我女儿最喜欢的玩具”等等，不仅识别语义，还能理解空间、识别物品、规划路径。在面对陌生物体时，机器人可以通过视觉识别提取特征，并结合语言指令进行语义解析，最终生成精准的操作路径，实现“感知-理解-行动”的无缝衔接。

DeepMind还研究了让Gemini Robotics On-Device模型适应不同的机器人。训练时，他们采用的是ALOHA机器人，但实验表明能够进一步将模型调整用于双臂Franka FR3机器人和Apptronik的Apollo人形机器人。

在双臂机器人Franka上，该模型可以执行通用指令，包括处理之前未见过的物体和场景、完成诸如折叠连衣裙之类的灵巧任务，或执行需要精准度和灵活性的工业皮带装配任务。

Apollo人形机器人则是完全不同的机器人形态，该模型也能相当好地适应。同一个通用模型可以遵循自然语言指令，并以通用方式操控不同的物体，包括之前未见过的物体。

更值得一提的是，该模型还支持边缘设备的轻量化运行，即便是资源受限的小型机器人也能实现高效智能操作。例如，在灾难救援或极端环境下，配备Gemini模型的移动机器人可以在无网络连接的情况下独立完成搜索、识别与操作任务，极大拓展了机器人的应用边界。这种跨平台、跨场景的灵活性，使Gemini成为推动机器人普及化与智能化的重要技术支撑。

不依赖云端，确保数据本地处理，恰是Gemini Robotics On-Device的革命性意义。这不仅降低延迟，在网络不稳定或者无网络环境中也适用，而且给用户吃了颗“隐私安全”的定心丸。在家庭、医疗、工业这样对数据封闭性要求较高的情景里，机器人从“能运行”升级到“可信赖”。

以往的AI专注于语言、图像等静态任务，GPT、Claude等系统虽然强大，但都无法动手。而Gemini Robotics代表了一种全新的认知-行动统一模型，AI从“脑”到“手”，实现了大模型与物理世界交互的根本突破。

我们现在已经可以畅想，当这类技术落地到家政、养老、教育、零售、甚至灾难救援等等场景，将带来多少便利与颠覆。

对你我这样的普通人来说，它可以成为家庭生活的深度陪伴者，一个升级版的“智能音箱+家庭管家+机械助手”，它会记住孩子的喜好、老人的用药时间、我们的早晚生活习惯等等。毋庸讳言，老龄社会将至，照护压力沉重。这种机器人能帮助起身、监测摔倒、语音沟通、情绪安抚，将会是未来生活的重要生产力。

Gemini机器人还能作为特殊教育、康复训练、心理疏导的辅助工具，尤其对孤独症儿童、语言障碍者等人群极具价值。具身智能带来的温柔与稳定，正是特殊人群教育和康复领域长久以来缺乏的“陪伴型支持”。在不替代专业人员的前提下，它可能成为更友善、更持续、更定制的辅助存在。

就像一个网友感叹的那样，Gemini Robotics On-Device正在成为“机器人版的安卓”。安卓系统的出现，让手机厂商摆脱了自研系统的负担，直接催生了移动互联网的生态繁荣。Gemini Robotics On-Device也具备类同的意义，它是可运行在各种机器人体型上的通用智能平台，只要硬件满足基本算力，它就能用Gemini模型来控制识别、规划、执行等能力。换句话说，安卓统一了手机的“大脑”，Gemini也正在尝试统一机器人的“大脑”。此外，安卓改变了人机交互的方式，让手机变得像电脑，而Gemini Robotics的目标正是进一步让AI变得“具身”，让机器人成为人类真正的助手。

Gemini Robotics On-Device所代表的不只是一次科技突破，它更像是一个时代的预演。我们离真正的具身智能时代又近了一步，人类将第一次面对一种既能听懂你、又能帮你干活的智能个体。未来的AI，不只是让你多知道一些，更是让你少做一些，甚至帮你做得更好，这也许就是AI最终的理想落点。

畅想未来很爽，但细观眼下，Gemini Robotics仍存在几大技术门槛。首先是稳定性与安全性，AI是否足够稳健，会不会做出危险动作？这仍需进行大量测试。人们是否真的放心把现实任务交给机器人，也是我们需要迈过的心理门槛。其次是能耗与成本问题。本地运行大模型要求芯片、硬件同时进步，相比“动嘴不动手”的语言模型，机器人需要长时间驱动视觉感知系统、运算中枢、机械执行组件，这对电池续航、散热系统、以及芯片能效提出了远高于传统AI的要求。另一个不可忽视的因素就是伦理与监管问题。具身智能机器人能实现“感知-决策-行动”的闭环，若它在行动中伤人毁物，责任由谁来承担？长期陪伴中，它有可能引发情感依赖、人格投射等问题，又该如何处理？此外数据的归属保护、机器人的自主性边界设定，这些都是前方未解之问。当具身智能令AI从信息空间进入物理现实，随之而来的不只是技术自由，更有治理责任。

相关链接：中国区支持的其他支付方式名单

shopify的套餐费用明细

AI下一个奇点出现？可能和你我都切身相关

后台教程

新手开店

关于我们

联系我们