继强势推出Sora2 App后,OpenAI又炸了个场。美国时间10月6日,OpenAI的年度开发者大会上,OpenAI更清晰地展示了自己的野心。
整场发布会的内容,就是在为我们勾勒一张蓝图,也可能是所有AI公司的未来路径:构建一个以AI为绝对核心的全新软件生态体系。
“大语言模型会成为所有软件的入口”,2024年还存在想象中的概念,在今年已经成为共识。OpenAI此次推出的Apps SDK,基于已建成的MCP体系。对,MCP,这不是一个新词。年初爆火的Manus,是第一个真正让公众“看见”MCP(Model Context Protocol)魅力的产品。过去,MCP还只是存在于开发者文档和技术演示中的协议概念,而在Manus的系统中,它变成了可触摸的智能体验——多个模型智能体能够基于MCP互联协作、共享上下文、主动调用外部工具,就像人类团队协作一样,完成复杂任务。
而OpenAI此次推出的Apps SDK,是首次将这一愿景的实现路径完整呈现出来。这是一套完整的开发堆栈,允许开发者在ChatGPT内部构建真实、可交互的应用程序。通过这套SDK,开发者可以连接自己的数据、触发具体操作、并渲染出完全交互式的用户界面。
此前,Claude、GitHub Copilot等其他产品虽有工具使用能力,但只是将外部服务的结果以文本形式返回,缺乏真正的上下文理解和自然的交互界面。换言之,过去的工具难以真正被“用起来”,而OpenAI的Apps SDK让用户能在大语言模型中像在电脑上一样使用App。
就在10月6日,OpenAI正式宣布,Booking、Canva、Coursera、Expedia、Spotify、Figama、Zillow等应用在ChatGPT上线。它们的集成版本已上线至非欧盟地区的ChatGPT用户端,覆盖Free、Go、Plus与Pro各版本。
用户无需在不同软件间切换,只需通过对话,就能在一个统一的入口中,让最合适的工具在最恰当的时机出现,并协同完成一项复杂的任务。
OpenAI发布的重要进展是使开发者可以设计其应用的逻辑和界面。结合GPT本身对图像的识别能力,它让App更自然地融合在了对话过程中。
因为对话和理解的便捷性,尤其是OpenAI在这场展示中着重强调的对上下文的记忆和理解,用户可以很容易地在GPT中调用多种App去完成同一个工作。这种强大的上下文理解能力,正是AI大语言模型有望成为主流软件入口的核心竞争力之一。
在这个生态中,App不再是功能孤岛,而是能被随时唤醒、能充分理解对话背景的“插件”,并以最合适的用户界面融入当前的对话流中。用户的主入口只有一个,就是ChatGPT的对话框。
在对话中,用户可以直接订机票、设计海报、生成图表,甚至打开播放列表。所有这些操作都在聊天窗口里完成,不再需要切换网页或打开独立App。无需切换界面,只要在对话中直接呼叫应用——“Spotify,帮我做个派对歌单”、“Booking,帮我订个纽约的房间”——ChatGPT就能在同一窗口中调用相关服务、展示交互界面,甚至完成支付或生成文件。它还会补上你的短板,根据对话内容主动推荐应用,例如当你在讨论买房时,ChatGPT可能会自动推荐Zillow应用,让你直接在对话中通过交互式地图浏览符合预算的房源。
这种“自然语言+应用接口”的模式,意味着对话本身成为了操作系统。用户与应用之间的边界随之消融,地图、课程、幻灯片、酒店搜索,这些熟悉的操作场景被自然嵌入到对话语境中,让用户体验从“搜索信息”变成“执行意图”。据介绍,未来数月内,还会有Uber、Target、Doordash、instacart、Tripadvisor等11家陆续加入。
对于开发者而言,Apps SDK的开放意味着一种新的“原生应用”形态。这套工具支持开发者定义应用的交互逻辑与界面,并可直接与自身后端系统相连,实现用户登录、会员服务或内容分发。开发者现在可进入预览阶段,测试自定义应用,并通过ChatGPT的“开发者模式”模拟运行环境。OpenAI已发布文档、设计规范与开源示例库,据悉在今年稍晚,平台将开放应用提交流程,并提供审核、上架与应用变现机制。
OpenAI官方称,“这只是ChatGPT应用生态的开始,它为用户带来了新的实用性,也为开发人员带来了新的机会。”如果发展顺利,一个真正的“AI应用商店”就会成形。
按照OpenAI的设想,开发者能构建功能模块,还能让自己的产品自然地出现在8亿ChatGPT用户的对话之中,在用户表达出需求时,出现在最合适的场景里。ChatGPT不再只是一个聊天窗口,而是一个操作系统级的服务层。它把应用变成“对话节点”,把交易变成“语言动作”,也让OpenAI有机会在这个生态里建立新的商业秩序:订阅分层、交易抽成、广告推荐。
这个模式也不是没有问题。任何新的入口革命,都是权力再分配的开始。过去的门户控制流量,搜索引擎控制信息,移动应用商店则控制分发,那AI门户时代呢?其他科技巨头也有App,谁会愿意入驻ChatGPT?
谷歌一定会根植于自家的Gemini,以最高优先级整合Gmail、Drive、Maps、YouTube等应用,以确保用户的每个行为都在谷歌体系内完成。Meta的逻辑也类似,它的护城河是社交关系链,AI必须服务于这个闭环。其他科技巨头如微软、Anthropic等AI公司,同样在押注各自的AI助手。一场关于“AI入口”的竞速,已经开打。
仅对ChatGPT而言,当多个App满足同一需求时,ChatGPT如何决定调用谁?这个快要成型的“App Store”,又怎么给App们排序?需不需要抽成?
目前OpenAI仅称,今年晚些时候,他们将会把应用功能扩展到ChatGPT Business、Enterprise与Edu版本,并开放应用提交入口,让开发者能在ChatGPT中发布自己的应用。届时,他们还将上线一个“专属目录”,用户可在其中浏览与搜索应用。符合开发者指南标准的应用将有资格被列入目录,而那些在设计与功能上表现卓越的应用将获得更高的推荐展示机会——无论是在目录中,还是在对话场景里。
此外,OpenAI称接下来将“很快”公布更多关于变现机制的细节,包括对Agentic Commerce Protocol(代理式商务协议)的支持,这是一项开放标准,允许用户在ChatGPT内实现即时结账。
另外在数据与隐私方面,也不能不重视。一个可以调动这么多App的AI,就相当于掌握了用户生活的“全息副本”。OpenAI官方称,开发者必须提供清晰透明的隐私政策,只能收集其运行所需的最少数据,并在权限使用上保持公开透明。
近几年各国监管在这方面越来越敏感,尤其是欧盟。OpenAI甚至在初期阶段主动排除了欧盟用户,明显是为了规避潜在合规风险。在数据合规、反垄断和消费者保护的各种约束下,AI入口未来预计又会成为监管者的靶子,一旦有什么问题就容易收巨额罚单。
当然,更重要的,还是新价值链的诞生。这一步看似是一次应用集成,实则是对整个互联网分发体系的重构。
互联网三十年,每一次入口更替都带来了新的产业秩序:门户网站改变了信息的组织方式,搜索引擎改变了知识的获取方式,移动商店改变了应用的分发方式,而如今,OpenAI正试图改变“服务的到达方式”。用户不再需要“找”什么,只需要“说”什么,AI成了新的中介层。
OpenAI又一次走在了前面。超8亿活跃用户,大量开发者的关注,让它占尽了先手。但谷歌、Meta、苹果等科技巨头显然也不会轻易让出“入口”这块权力之地。这场博弈,或许有机会像当年的浏览器之战、移动操作系统之战一样,打开我们的想象空间。
相关链接:中国区支持的其他支付方式名单