
每到年底,AI圈总是格外热闹。ChatGPT 5.1、Grok 4.1相继发布后,Gemini 3可谓万众瞩目。
谷歌果然不会令人失望。当地时间11月18日,Gemini 3正式发布,而且一发就是顶配的Gemini 3 Pro。
谷歌CEO皮查伊在谷歌官方博客上写道:Gemini 3是我们目前最智能的模型,目标是让用户把任何想法变成现实。
这个迄今为止,推理最强、多模态理解最强,“智能体”+“氛围编程”最强的模型,再一次定义了SOTA(State Of The Art,当世最强),用近乎恐怖的实力,碾压各大模型。
马斯克和OpenAI的奥特曼也都发来贺电。
用谷歌的话来总结,Gemini 3 Pro顶尖的核心在于这三点——
霸榜LMArena(1501分)和WebDev(1487分);
人类最后考试(HLE)刷出45.8%最高分,人类博士级推理;
长程任务规划Vending-Bench 2上的王者。
它的典型应用场景包括:具备自主行为能力的应用、高级编程、超长上下文理解、跨模态处理(如文字、图像、音频的结合),以及算法开发等。
Gemini 3 Pro预览版在LMArena排行榜上以1501分的成绩位列榜首,在几乎所有主要AI基准测试中都远超上一代2.5 pro,全面压制了Claude Sonnet 4.5和GPT-5.1等主要竞品。
Gemini 3 Pro的进化不仅在于能力的飞跃进阶,还在于交互的质感。它摒弃了以往AI常见的陈词滥调和过度奉承,更加聪明、简洁且直接,告诉你需要听到的,而不仅仅是你爱听的。就像一位真正的思想伙伴,提供理解信息和表达自我的新方式,不管是生成高保真可视化代码,阐释晦涩的科学概念,还是展开一场激发创造性的头脑风暴,Gemini 3 Pro都能做到。
除了在文本测试中的优异表现,Gemini 3 Pro还是多模态王者。
Gemini从一开始就旨在无缝整合任何主题的多种模态信息,包括文本、图像、视频、音频和代码。Gemini 3更是实现了破级进阶,整合最先进的推理、视觉和空间理解、领先的多语言性能以及100万token上下文,进一步拓展了多模态推理的边界,帮助你以最适合自己的方式学习。
例如,如果你想学习如何烹饪家族传统菜肴,Gemini 3可以解读并翻译不同语言的手写食谱,生成可与家人分享的食谱。
或者,如果你想学习某个新主题,就可以为它提供学术论文、长篇视频讲座或教程,它可以生成交互式记忆卡片、可视化或其他格式的代码,帮助你掌握相关知识。甚至它可以帮你分析你的匹克球比赛视频,找出可以改进的地方,并制定训练计划,帮助你全面提升球技。
在氛围编程上,Gemini 3直接刷爆了天花板。正如谷歌官方博客描述的那样,Gemini 3是目前最强的“vibe coding”模型,它能精准get使用者的意图,并知道如何去实现。你只需用自然语言描述想要什么,它就能生成功能完整的互动应用,简单给它一句话,就能得到一个美观且灵动的应用。
这一次,谷歌首次在Gemini新版本发布当日就直接集成进谷歌搜索,显然想借此重构搜索体验。Gemini 3.0不仅能显著提升搜索对复杂问题的理解与信息挖掘能力,还能根据查询即时生成动态视觉界面、互动工具与模拟系统,如三体物理模拟器或贷款计算器。
自谷歌通过Gemini 2开启智能体时代以来,一直在不断进化,他们不仅提升了Gemini的编码智能体能力,还提高了其在更长时间范围内可靠规划未来的能力。这点刚刚在Vending-Bench 2排行榜上得到实力认证——Gemini 3以绝对优势登顶。
这个测试,是通过模拟运营一个自动售货机业务,深度考验AI在复杂场景下的长程规划能力。在整个模拟运营年度中,Gemini 3 Pro通过保持一致的工具使用和决策,在不偏离任务的情况下,实现了更高的回报。
这就意味着,Gemini 3能在日常生活中更好地帮人类完成任务。它把更深度的推理与改进、更一致的工具使用相结合,通过从头到尾处理更复杂、多步骤的工作流来代表人采取行动。比如帮我们预定本地服务,整理收件箱,我们全程只需把控方向,下达指令。
Gemini 3的问世,标志着谷歌在智能体能力上已开始迈入一个新的阶段:模型能够在多个平台上长时间运行,且无需人工干预。虽尚未达到“完全无人干预+连续运行数天”的程度,但谷歌正日益接近这样一个世界——不再通过单个提示词或工具调用,而是在更高的抽象层面上与智能体进行交互。
因此,谷歌智能体开发平台Google Antigravity正式上线,一个让开发者以“任务”为维度与智能体协同的全新平台。借助Gemini 3高级推理、工具使用和智能体编码能力,Google Antigravity将AI辅助从开发者工具包中的一种工具,升级为全程参与的主动协作者。
在熟悉的AI IDE体验基础上,Google Antigravity为智能体开辟一个专用界面,可直接访问编辑器、终端和浏览器。现在,智能体可以代表你自主规划并同时执行复杂的端到端软件任务,同时验证其生成的代码。
除了Gemini 3 Pro,Google Antigravity还与Gemini 2.5计算机使用模型,以及图像编辑模型Nano Banana(Gemini 2.5 Image)紧密集成。
即便不看参数,Gemini 3的实际水平也有目共睹。谷歌能在短时间内追平甚至超越OpenAI数年的积累,关键就在于它是为数不多具备全栈能力的AI厂商。
从这个层面上看,谷歌的优势显而易见:Gemini 3完全在谷歌自研的TPU系列处理器上完成训练,这是不可忽视的算力自主权,加上全球最大的数据宝库——搜索索引、学术文献、YouTube视频库,都为Gemini的训练提供了强大助力。这或许也解释了为什么它在处理实时信息、多语言任务、视频理解等场景时表现更稳。
从自研TPU、海量数据闭环到庞大的产品矩阵,这些共同构筑了强大的生态壁垒,将AI从一个独立工具转变为嵌入用户日常工作流的执行系统。这种全栈控制带来的优势,体现在三个层面:
第一层是算力自主。OpenAI在今年前9个月算力支出超过86亿美元,Anthropic向Azure购买300亿美元算力,都需要向云服务商租用,而谷歌的算力掌握在自己手中。
第二层是数据闭环。搜索每天数十亿次查询,Gmail数百亿封邮件,YouTube数十亿次观看,这些数据既是训练素材,也是持续优化的反馈。其他公司要么花钱买数据,要么面对版权诉讼。
第三层是产品矩阵。Gemini 3可以在搜索中测试理解能力,在Gmail中测试生成能力,在Android中测试智能体能力,每个产品都是真实的能力验证场。
三层优势叠加,形成了一个其他AI公司无法复制的闭环:自主算力让大规模部署成为可能,海量数据让持续优化成为现实,产品矩阵让能力验证贯穿全链路。谷歌不是在做一个更好的AI工具,而是在重构计算的底层逻辑。
当AI成为所有数字服务的新界面层,要做的就不是一个产品,而是重构整个生态。这就是Gemini 3真正强的地方:它是唯一一个在发布当天就让数十亿人用上的AI,而这是其他AI公司最难望其项背的。
Gemini 3现已全面开放。即日起,普通用户和订阅用户分别可通过Gemini App及搜索AI模式使用新模型;开发者与企业客户也能通过AI Studio、Vertex AI等渠道接入。备受期待的“深度思考模式”也预计将在未来几周内面向Google AI Ultra订阅用户独家上线。
定价方面,Gemini 3.0 Pro引入了基于上下文长度的分级定价机制:200k tokens以下的任务,输入/输出价格为$2.00/$12.00(每百万token);超过200k tokens则分别为$4.00和$18.00。
在X博主Chubby发起的“到2026年底,哪家公司拥有最好的LLM?”投票中,Google Gemini遥遥领先。
这种市场信心的回升也体现在了数据上,谷歌CEO皮查伊在官方博客中回顾了Gemini过去两年的进展:AI Overviews月活跃用户已达20亿,Gemini应用月活突破6.5亿,此外更有超过70%的云客户以及1300万开发者正在使用其生成式模型。
回望过去两年,从Bard(Gemini前身)发布时的仓促应战与股价暴跌,到痛定思痛合并Google DeepMind、召回创始人、斩获诺贝尔奖,谷歌完成了一场教科书般的逆袭。
那个曾经定义了Transformer、如今“All in Gemini”的巨人,已经做好了全面反击的准备。
相关链接:中国区支持的其他支付方式名单