• 2025

    04-02

    小米SU7高速事故,对智驾的反思别跑偏了

        3月29日22时44分,一辆小米SU7标准版在安徽德上高速公路池祁段行驶过程中遭遇严重交通事故,导致3人在车祸中丧生。     4月1日午间,小米官方发布声明,公告了事故发生详细时间线和相关数据,但更具体的事故原因和细节还需等待当地交警进一步披露。据小米公司发言人回应,事故发生前车辆处于NOA(Navigate on Autopilot,导航辅助驾驶)状态,以116km时速持续行驶。事发路段因施工修缮,用路障封闭自车道、改道至逆向车道。车辆检测出障碍物后发出提醒并开始减速,随后驾驶员接管车辆进入人驾状态,持续减速并操控车辆转向,随后车辆与隔离带水泥桩发生碰撞,碰撞前系统最后可以确认的时速约为97km。     小米官方称,碰撞发生后,立即与车主取得联系,确认非车主本人驾驶。同时紧急救援呼叫车上乘员,并报警、呼叫120急救服务。此后警方抵达现场介入调查。     值得一提的是,在识别到前方障碍物时,汽车通常还会触发AEB功能(Autonomous Emergency Braking,自动紧急刹车系统),但小米公司的通告中尚未提及事故车辆的AEB状态。     事件发生三天,以往“24小时冲浪”人设的雷军罕见地处于失语状态,可对比的是2018年特斯拉自动驾驶致死事故后,马斯克亲自道歉最终挽回部分信任。作为小米公司的第一品牌代言人,雷军的态度及动向或成为小米在此次危机中舆情走向的关键变量。     4月1日22时20分,雷军微博终于发布最新动态,表态“无论发生什么,小米都不会回避”。与其往日保持高频更新的节奏不同,此时距离其上一条微博动态,已超24小时。     据小米官方信息显示,小米智驾系统分为两套方案,分别是Xiaomi Pilot Pro和Xiaomi Pilot Max。小米SU7 Pro标配Xiaomi Pilot Max平台,搭载1颗激光雷达、3颗毫米波雷达、11颗高清摄像头及12颗超声波雷达,由两颗NVIDIA DRIVE Orin提供508TOPS的综合算力。     小米SU7标准版搭载的是Xiaomi Pilot Pro智驾系统,配备1颗NVIDIA DRIVE Orin芯片、1颗毫米波雷达、11颗车外摄像头、12颗超声波雷达,没有激光雷达。     技术人员分析称,小米SU7标准版没有激光雷达,纯视觉模式在夜间识别效果相对欠佳,可能存在障碍物识别不够及时到位问题。     由于此次高速事故还在调查中,无法判断小米智驾系统是否存在障碍物识别延迟、接管预警滞后及制动响应迟滞等问题,但可以肯定的是,普通用户难以分辨小米智驾系统两套方案的具体差别,他们对小米智能驾驶的了解更多地来自雷军在不同场合对小米SU7智能驾驶的阐述。     就在小米SU7事故发生的几天前,问界车主“秦风”在鸿蒙智行APP发文称,去年十二月下旬,他在开启高阶智驾的情况下,以120km时速追尾了前方停着的水泥泵车,导致腰椎、腓骨骨折,全身多处不同程度挫伤。     几起事件,给火热的智驾发展态势兜头浇了一盆冷水。“不能把生命交给机器”的呼声越来越大,用户的信心多少都被蒙上了阴影。     智能驾驶的发展太令人兴奋,导致我们忽视了背后一些不得不说的事实。其中最突出的就是,消费者常会以“自动驾驶”来理解“智能驾驶”。     企业的宣传,永远主打一个通俗易懂,永远追求最大传播效率,用户这种误解,本身极可能是企业有意无意中造成的。产品的宣传只要不违反广告法即可,但写进用户手册就是另外一回事。     在说明书中,白纸黑字提及:“驾驶员应始终手握方向盘并保持警惕,密切注意周围各种危险情形,必要时及时人工干预或接管车辆”。而消费者只会看到发布会和宣传片上的精彩瞬间,却不会去认真品味说明书上字里行间的那些条款。这就会引起巨大的认知偏差:消费者只看到了智能驾驶系统的精彩瞬间,看到了技术的神奇力量,对自己也能用到这种技术欣喜莫名,却不会意识到再怎么先进的技术,终究也有其能力边界。     2024年前,中国新能源汽车卷的是电动化,竞争主要围绕电池、电机、电控展开,而2024年之后,竞争卷向了智能化,NOA/NCA等等新名词开始出现,L2/L3等等新概念开始传播。     按照美国汽车工程学会的等级分类,自动驾驶的等级从L0无自动化、L1辅助驾驶、L2部分自动驾驶、L3条件自动驾驶、L4高度自动驾驶到L5完全自动驾驶,级别依次提升。其中L1/L2等级仅具备简单的环境感知和执行功能,实则应该被称为“辅助驾驶”,主要操作仍应由驾驶员完成。但在激进的宣传和造势之下,不少车企模糊了这种限定,使得消费者过分信任辅助驾驶,以至于以身犯险,发生事故。     这六大梯级背后的逻辑,最根本的不是搭载了多少传感器,有多少芯片算力,而是控制权与责任的归属。     有车主在事故后紧急做功课才了解,车企在宣传时强调“无限接近L3”、“高阶智驾”,听起来比“辅助驾驶”更高级,但本质上仍是L2级别。根据工信部《汽车驾驶自动化分级》标准,L2级属于“组合驾驶辅助”,系统仅能执行部分动态驾驶任务(如车道保持、自适应巡航),驾驶员必须全程监控环境并随时准备接管。     这意味着,无论车企如何宣传,只要未通过国家认证的L3级标准,均被归类为L2级辅助驾驶。就像前文说的小米两套系统,高价高配,低价低配,但两套系统事实上也都属于L2级别,在现行法律下,如果发生事故,仍由驾驶员承担主要责任。     目前虽然有国内车企发布L3级技术方案,但尚未有车企通过国家认证实现L3级自动驾驶的全国覆盖。包括被业内认为技术领先国内1-2年的特斯拉FSD,全称是“Full Self-Driving”,直译过来就是“全自动驾驶”,但在进入国内时,仍然正式改名为“智能辅助驾驶”,预示着特斯拉也已认清现实,不再盲目追求全自动驾驶。     但不要以为L2的辅助驾驶就意味着厂商不用在事故里担责,哪怕具体某次事故里,从法理层面用户自己应该承担一切或者主要责任(例如美国Joshua Brown和中国高雅宁都因使用特斯拉AutoPilot不当而丧生),这也并不意味着企业丝毫不用反思和被谴责,极端式理解会带来更为恶化的后果。     国内智驾竞争态势已臻白热化。就在3月,小鹏推出了更强更便宜G6、G9,问界M9推出了激光雷达硬件升级服务、长安汽车也宣称要把高阶智驾的价格战打到10万以内。本质上来说,这就是一轮“技术平权...

  • 2025

    03-27

    DeepSeek赢了…但刚刚谷歌Gemini后来居上

         时隔俩月,DeepSeek终于更新了。      3月24日晚,DeepSeek一声不吭往Hugging Face上扔了个DeepSeek-V3-0324模型,模型参数6850亿,与上一个版本V3的6710亿相差不大,采用MoE架构,还支持了更开放的MIT开源协议。      根据官方更新的版本说明,DeepSeek-V3-0324主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟R1对齐,另外还有一些其他方面的小优化。现在只要打开DeepSeek官网,把深度思考模式关掉就能直接用上V3-0324。      虽然这个举措看起来只是DeepSeek V3的一个小升级,但低调不代表没有反响。V3-0324刚上线,就登上了Hugging Face的趋势榜单,引起业内轰动,体验过的网友说它的代码能力已经直追Claude。例如让V3-0324生成一个网页,模型一口气写了800多行代码,运行的时候还没有出错,这实力就不用多说了吧?有人仅仅下达了编写登录页面的简单指令,并没有任何其他的附加提示,V3-0324同样也生成了一个完整的登录页面,比起V3生成的“乞丐版”,相去不可以毫厘计。      在国外大模型竞技场KCORES的测评中,V3-0324的代码能力得分为328.3,超过了普通版的Claude 3.7 Sonnet的322.3分,接近Claude 3.7 Sonnet思维链版本的334.8分,排名第三。这个排行榜上前几名的模型就几乎没有开源的,DeepSeek在其中一枝独秀。      DeepSeek-V3-0324面世时没有附带白皮书,也没有任何宣传,只有一个空的ReadMe文件。这一近乎朴素的发布形式,与硅谷模型面市时的精心策划迥异。3月25日晚上,DeepSeek官方终于发文正式介绍了这波小更新,在数学、代码类的相关评测上,V3-0324比OpenAI目前最厉害的非推理模型GPT-4.5都要更胜一筹。体验过的网友直呼这次的更新超出预期多多,尤其在编程方面,是目前最强大且完全免费的AI。而最好商业模型之一的Claude Sonnet则要按月收取20美元的费用。      经测试,DeepSeek-V3-0324的各方面能力,已经可以和Claude 3.7 Sonnet掰一掰手腕。从性价比方面看来,OpenAI的o1-pro和GPT-4.5都已经不香了。在开源这个赛道上,DeepSeek的竞争力毋庸置疑。      DeepSeek的API价格也主打一个便宜。V3-0324百万tokens输入的价格是2元,输出的价格是8元,而同样的tokens数,Claude 3.7 Sonnet的输入和输出价格分别是36.6元和108.9元,价差最多达18倍。      DeepSeek的运行方式也格外“环保”。它从根本上重新构想了大型语言模型的运作方式,在特定任务期间仅激活约370亿个参数而非全部,也就是所谓的“专家”模块,这大大降低了计算需求。      该模型还有另外两项突破性技术:多头潜在注意力(MLA)和多标记预测(MTP)。MLA增强了模型在长篇文本中保持上下文的能力,MTP每一步生成多个标记,而不是通常的一次生成一个标记,这两者共同将输出速度提高了近80%。      某种程度上,DeepSeek体现了中国企业对效率和资源极致追求的精神,即如何以有限的计算资源实现相等或者更加优化的性能,这种由需求驱动的创新已经使中国的人工智能在几个月时间内震惊了全球,与世界顶尖对手的距离不断在缩短。      然而就在DeepSeek更新后不到30小时,谷歌最新模型Gemini 2.5 Pro实验版本也深夜上线了。这一模型在多项基准测试中全面超越OpenAI o3-mini、Claude 3.7 Sonnet、Grok-3和DeepSeek-R1,一经亮相便在大模型竞技场获得1443分,而且创下了历史最大分数飞跃,凭借39分的大幅优势,获得断层第一。      谷歌宣称,这是一个“思考”模型,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的Gemini的所有功能(长上下文、工具等)。此言非虚,Gemini 2.5 Pro在多个基准测试中达到了SOTA(State-of-the-Art,即当下最先进)水平,尤其在推理和编码上更是领先一步。      谷歌表示,在AI领域,系统的“推理”能力不仅仅指分类和预测,而是指系统分析信息、得出逻辑结论、融入上下文和细微差别,以及做出明智决策的能力。      长期以来,谷歌一直在探索通过强化学习和思维链提示词等技术,让AI更智能、更具推理能力的方法。      正是在此基础上,他们在2月推出了第一个思考模型,Gemini 2.0 Flash Thinking,它能够进行多步推理,并让用户实时追踪它的推理过程。      而现在,通过Gemini 2.5,他们结合了显著增强的基础模型和改进的后期训练,让模型达到了新的性能水平。Gemini 2.5 Pro的核心创新在于把推理作为系统底层能力来构建,模型能够在充分思考和权衡之后才给出解决方案。      相较于只把推理当作“外挂”的做法,这种全方位的整合让模型在回复时更准确、更贴近真实场景,也更能捕捉用户的上下文含义和细微差异。事实证明,这种转变确实大幅提升了模型的表现。      在谷歌自家的多项评估中,Gemini 2.5 Pro取得了极为抢眼的成绩:      在高度复杂的推理基准上稳居榜首,并且无需依赖昂贵的投票或其他变通手段。      在GPQA与AIME 2025等基准中都领先于同类产品。      面对难度极高的Humanity’s Last Exam(人类最后考试,由数百名专家构建,用来测试人类知识和推理极限)这一基准测试,更是拿下了18.8%的优异成绩,而且全程未借助任何工具辅助。与OpenAI o3-mini相比,其得分提升了近5%,提升比例达34%。      编码能力的飞跃同样值得一提。相比Gemini 2.0,2.5 Pro在构建Web应用、编写代理式代码以及进行代码转换等任务上都有重大突破。在SWE-Bench Verified(专门用来衡量代理编码水平的基准)中,更是靠着定制代理配置取得了63.8%的表现。      比如在下面这个demo中,仅仅根据...

  • 2025

    03-20

    太空人返乡记

          美国东部时间3月18日下午6点,在国际空间站滞留了286天的美国宇航员布奇·威尔莫尔(Butch Wilmore)和苏尼·威廉姆斯(Suni Williams)搭乘SpaceX“自由号”载人龙飞船成功返回地球,并在佛罗里达州塔拉哈西海岸安全着陆,最具悲剧色彩的太空人终于回家了!       2024年6月,两名宇航员搭载波音公司的“星际客机”抵达国际空间站,原定任务仅持续约10天。但由于返回舱出现技术故障,他们的返程不断推迟,最终被迫在轨道上停留了近9个月,这使得他们跻身美国宇航员连续在轨时间最长的前六名。       美东时间周二凌晨1点刚过,威尔莫尔和威廉姆斯乘坐SpaceX“自由号”飞船与国际空间站成功分离,开始他们的返程之旅。经过17小时的飞行后,飞船成功降落在墨西哥湾的温暖水域,迎来了久违的重返地球时刻。       威尔莫尔和威廉姆斯被救援队迅速接回,并与美国宇航员尼克·黑格(Nick Hague)和俄罗斯宇航员亚历山大·戈尔布诺夫(Alexander Gorbunov)会合,随后他们将被送往休斯顿的约翰逊航天中心,接受数天的医学评估。       出手收拾波音留下的烂摊子,马斯克的Space X这次又大大露了一把脸,狠狠挫伤了老对手的自尊心。不知这个好消息,是否能让正被特斯拉折腾得焦头烂额的老马精神一振? 中国区支持的其他支付方式名单 shopify的套餐费用明细

  • 2025

    03-20

    下个十年,这些产业最赚钱

    整个世界的运转逻辑在近年发生了一些根本性变化,并且以美国挑起贸易争端、俄乌冲突、新冠疫情、房企爆雷等种种尖锐的方式爆发出来。面对杀伤力惊人的不确定性,越来越多企业的经营状态不稳定,企业家内心的焦虑和迷茫与日俱增。 于是,很多人试图去关注未来到底会发生什么,然后针对这些变化去筹划自己的策略。这无可厚非,但若沉溺太久,从投入产出比来看并不划算,因为太多事情都不在我们可控的范围之内。 这时候我们更该做的,是寻找确定性,在一定会发生的确定性中寻找自己能发挥的空间。顺势而为,才能事半功倍。 尤其对于企业家,不要去过多关注经济周期。经济周期起起落落,我们也很难定位自己正身处于哪个阶段。 企业家更应重点关注的,是趋势。趋势不同于周期,它虽然会偶尔受到周期性波动的干扰,但长远来看它是稳定的,不会很快改变或走势成谜。针对已经发生而且预期会影响未来经济发展的趋势去做分析,去决定向哪个方向趋进,要不要跨入新行业。 今年作为十四五规划收官和十五五规划谋篇的关键节点,刚刚结束的两会通过了一系列重要决议,涵盖经济、科技、民生、法治等领域。我们从中能看到国家的风向标,其中也潜藏着很多趋势机会。 比如政府工作报告提到的新兴产业和未来产业。新兴产业,涵盖以下几个方面: 商业航天:推动卫星互联网、火箭发射等产业链完善,2023年市场规模达6582亿元,重点布局北京“南箭北星”、上海卫星制造、海南发射场等区域。 低空经济:涵盖无人机物流、低空旅游、应急救援等场景,2023年市场规模5059.5亿元,预计2026年突破万亿元。 智能网联新能源汽车:深化自动驾驶、车联网技术应用,2023年全球销量超1400万辆,中国占比超60%。政策延长购置税减免至2027年,推动充换电网络覆盖90%县域。 新一代信息技术:5G规模化应用加速,工业互联网与算力资源优化协同,目标打造国际竞争力数字产业集群。 未来产业则涵盖以下几个方面: 生物制造:以合成生物学为核心,开发生物基材料替代化工原料,预计2033年市场规模将达2万亿元。重点突破菌株构建、生物炼制技术,推动医药、农业领域应用。 量子科技:量子科技是当今科技领域的前沿方向,涵盖了量子计算、量子通信和量子测量等多个重要分支。《国家和商业的量子技术:现状和未来》报告称:全球量子通信市场规模到2035年将达到200亿美元,其中主要份额来自设备和基础设施。 具身智能:即人形机器人,首次被写入政府工作报告,足以彰显其重要性和发展潜力。宇树科技的机器人产品在春晚大放异彩,让这类高科技和百姓生活一下亲近了起来。在技术层面,目前重点要突破关节控制、感应器集成等核心技术。 6G通信:6G被定位为低空经济与商业航天的技术底座,政府提出“优化算力布局”,“加快卫星通信研发”,支持空天地海一体化网络。未来6G通信将广泛应用于智能网联汽车、无人机物流等领域。 脑机接口与光子技术:脑机接口技术致力于实现大脑与外部设备的直接通信。以强脑科技为代表,他们在脑机接口技术研发和产品应用方面取得了诸多成果,推出了一系列脑机接口设备,用于医疗康复、神经科学研究等领域。光子技术中的光子芯片具有高速、低能耗等优势,在数据中心、通信等领域具有广阔应用前景。 全球格局下,去年第四季度,麦肯锡发布了一份报告《The next big arenas of competition》(下一个重大竞争:改变商业格局的行业领域),用200多页篇幅,详细分析了未来最有可能改变全球商业格局的18个赛道,并预测2040年,这18个赛道将实现29万-48万亿美元的收入,贡献18-34%的全球GDP增长,我们不妨一起来看看。 电商:麦肯锡预测,到2040年,电商在全球零售收入的占比可能会达到27%-38%(目前约为20%)。电商行业的增长点,在于发展中国家的市场扩展,或者是发达国家中新品类的增长,比如医疗保健、珠宝和手工艺品等,更具“情绪价值”的产品。因为它们更容易通过叙事的方式,在社交电商销售。 电动汽车:电动车在全球乘用车销量中的占比,会在2040年超过50%。 云服务:世界正变得更加互联,对企业提出了更高的储存和计算能力要求,AI产品更需要大量的算力。据麦肯锡分析,该行业的收入从2005年到2020年的年复合增长率有17%,未来几十年,大概也会以类似或者稍缓的速度增长。 半导体:半导体是数字世界的基石。计算和数据存储、汽车、通信和工业电子等领域的需求,都会推动半导体行业快速增长。麦肯锡预测,该行业未来十几年会持续6%-8%的年复合增长。 AI软件服务:AI助手正广受青睐,AI企业也正在进行军备竞赛,打造最先进的基础模型和应用。 数字广告:即通过搜索、社交和媒体,进行广告服务。随着上网的中产阶级增加,每人上网的时间增多,数字广告的商业价值正在持续扩大。算法的不断进步,也提升了平台定位客户和追踪广告成本的能力。但平台之间,为了争夺用户的注意力,又必须加大投资,做出最能吸引用户的内容。 流媒体视频:因为用于获客和内容制作的投资不断增加,流媒体平台也许要寻找更多盈利方式,进行自我革新。大量发展中国家或会为流媒体的内容订阅和广告收入提供增量。麦肯锡预测,到2040年,订阅长视频服务的家庭数量可能突破10亿。 共享自动驾驶汽车:随着自动驾驶技术的落地,未来我们可能不用买车,只需“共享”,当然这个未来并没有那么近。麦肯锡预测,2040年共享自动驾驶汽车可能会占据共享出行25%到51%的收入。 太空:不久后,我们的世界可能就要进入太空经济时代。此前,航空业基本上被认为是一种生产“一次性”奢侈品的行业,成本极高。但SpaceX的出现,让重型火箭也可以分级“可回收”,将来还可能像飞机一样“航班化”。 网络安全:2020年,网络犯罪造成的直接经济损失约9500亿美元,间接损失可能要到4-6万亿美元。越来越多的企业开始重视网络安全,加大投资力度,提高网络安全支出。 电池:过去几十年,电池的能量密度(能量和重量比值)增长了3倍以上,在技术上取得了突破性进步。全球的能源转型,推动了对电池的需求。据麦肯锡预测,2040年,电动汽车在整个电池市场的占比可能会超过80%。 电子游戏:麦肯锡预测,到了2030年,全球可能有40%的人口成为电子游戏玩家。移动游戏和云游戏的新模式,让娱乐过程变得更快速简洁,推动了市场大量增长。免费网游正在给游戏厂商带来大量收益,2025年发布的3A游戏预算已经达到2亿美元。 机器人:AI长出了身体,机器人拥有了大脑。人形机器人如今被业内寄予厚望,期待它们成为“终极智能体”。 工业和消费生物技术:随着编辑基因等技术突破,生物技术将会在如农业、替代蛋白(人造肉、蛋、奶)、消费产品和服务、生物材料等领域加速应用。 模块化建筑:指的是在工厂预制好各种模块,到了现场再拼起来,能大幅提高建筑的生产效率。从全球来看,住房短缺和房屋较贵的问题仍广泛存在,模块化建筑虽然在日本、北欧一些劳动力成本比较高的地方已经普及,但在全球的份额还有待提高。 核裂变发电:更安全、更小型的模块化反应堆,为补充可再生能源带来可能。在2023年的联合国气候变化大会上,20多个国家承诺到2050年,把核能产量提高两倍。 空中交通:电动垂直起降飞行器和配送无人机会是这个领域的重大技术变革。目前已经出现...

  • 2025

    03-14

    Manus横空出世,催生智能体元年?

          3月6日凌晨,AI创业公司Monica.im发布了通用型产品Manus,产品名源自拉丁语“手”,象征着将AI从理论思维延伸至实际操作。Monica.im强调,Manus的设计目标是突破传统对话式AI的局限,通过“自主执行”能力,它不仅能够理解用户需求(听懂复杂指令进行推理),更能独自完成从任务规划到实际操作的全过程(顺滑对接完成该任务的各个环节,将最终结果给到用户),从创建网站、规划旅行到分析股票,Manus都能很好完成,呈现出较好的通用性和执行力。       随后在众多科技博主的评测下,这款被冠上了“全球首款通用AI Agent(AI智能体)”的产品迅速小范围出圈,引发市场关注。       AI Agent,又被称作AI智能体,即一种能通过对环境的感知,进行思考决策并执行的智能体。与GPT等应用相比,AI Agent在思考与行动方式上和人类很相似,就像一个能感知、能理解、能行动的AI助手。       Agent概念,并不是当今的产物,而是人工智能不断进化的结果。经过几年的淬炼,用户对AI的期待早已超越简单问答,他们恰就需要这样一个能主动思考的助手,这种供需错位给了AI Agent爆发的机会。       Manus创始人肖弘在Manus发布的前几个小时,在即刻平台上发文“高潮来临”。很难现在就判定Manus的诞生就是AGI的里程碑,但它很有可能将让Agent时代真的进入“高潮时刻”。       与DeepSeek的破圈不同,围绕着Manus的正负声量都很大:有人认为这是继DeepSeek后的又一场技术革命,也有人认为它不像DeepSeek那样在底层技术上实现了重大突破,也没有自研模型,而是“套壳”了Claude和阿里的通义模型。       从技术角度看,Manus本质上是基于基座大模型的系统性工程优化,通过构建多智能体协作框架,将任务划分为“规划-执行-验证”三个阶段,由不同AI代理接力协作,模拟人类处理复杂任务的流程。同时针对不同应用场景设计了多层次环境适配机制,最终形成面向复杂任务的高度工程化整合方案。       在交互体验方面,Manus的核心能力体现在对用户需求的洞察,它最后交付的不仅仅是文字,而是借助代码生成了各类契合任务需求的结果,涵盖了文档、网页、图标甚至是视频。由此,用户能够更加直观地获取到自己想要的结果,还能在过程中对最终的交付结果进行验证。       执正方观点的业内人士表示,Manus是用工程能力去挤压出了模型可完成的最复杂的任务,构建出一个远超单一模型调用的多模型协同网络,展现出了非常出色的系统集成能力,“很接近数字版AI Agent的样子”,为用户带来了更强的掌控感与丝滑的体验感。       例如,在利用Manus生成市场报告时,它能自动调用数据分析工具和设计平台完成全流程,形成“端对端”解决方案。再比如,让Manus筛选简历,只需将存有多份简历的压缩包直接发给它,它会自动解压,浏览找出重要信息,给出候选人评估结果,甚至还能将候选人姓名和重要信息做成表格,方便用户查阅。       与普通大模型不同,Manus不只是提供想法,还能帮用户把想法变为现实,解决实际问题。这背后的核心竞争力在于其全链路自主执行能力——Multiple Agent架构。用户不需要去对话引导,也不需要提供建议,只需要等待Manus直接交付完整的任务成果。       而反方认为,Manus没有发布任何官方详细的技术报告,交互界面类似Devin和Artifact,只不过是个超级缝合怪,而且它的技术并不成熟,存在不少事实性错误。连带着,对Manus的邀请码饥饿营销(人脉炫耀)+KOL尖叫体测评(“人类输了!”等等)+借势其它明星产品(绑定DeepSeek)的一系列营销手段都大表反感。       但不论观点为何,Manus的意义是不容抹杀的,它代表的,其实是另一场竞赛——AI应用。       在多位业界大佬的眼中,2025年都有望成为AI Agent元年。推理大模型涌现出让人惊叹的深度思考能力,这将推动人工智能的一个重要应用方向,即“AI智能体”的落地。如果说大模型让AI长出了“脑”,那AI Agent就是让AI长出了“手”和“脚”。       据Root analysis预测,全球AI Agent市场规模,将从2024年的52.9亿美元,增长到2035年的2169亿美元,期间复合年增长率将达到40.15%。       广阔的市场空间背后,围绕AI应用,在全球范围内,大模型厂商间的角逐无疑将进一步走向激烈。       肖弘这样回应关于“套壳”的争议:所有突破都是模型带来的,基本上是模型先驱动、模型先行。壳是要把模型技术上的创新点,以一个用户可感知的方式展示出来,把模型创新能力封装成用户最能感知的样子。       从这个定义出发,DeepSeek App(包括思维链的展示)是DeepSeek-R1的壳,Cursor是Anthropic Sonnet 3.5的壳,Perplexity是GPT-4的壳,ChatGPT是InstructGPT的壳。       随着模型能力快速进化,“壳”也需要进化。每一代模型能力进化之后,甚至不一定是原厂,是一个第三方厂商把它的用户可感知价值给呈现出来。       “套壳”本身并不可怕,可以视为一种整合和优化资源的方式,关键在于是否能够解决用户的实际问题。用户更在乎的是产品体验,有没有迅速且准确地获得所需的内容,而不是底层用了什么,如何调用工具。       单纯的套壳在AI普及的背景下,难以成为核心壁垒。真正重要的是找到市场需求和商业逻辑,利用AI这个“通用商品”创造独特的价值。换句话说,套壳只是起点,关键在于如何构建需求驱动的差异化优势。       但套壳不应该是终点。Manus能够将现有技术包装并推出满足用户需求的产品,应用端的创新同样不可忽视。       在Manus之前,领先的模型公司中,唯一做过这个尝试的是谷歌。2024年12月12日,谷歌推出Gemini的同时,也推出了一个Agent系统Project Marine...

  • 2025

    03-07

    全球化2.0时代,给出海人的“答案之书”

          在国内市场疯狂内卷和全球产业链重组的大环境下,出海已成为2025年最大的确定性之一。对中国创业者来说,出海无疑是未来几年最重要的机遇和挑战,对中国来说,出海极有可能成为支撑经济发展的下一个增长引擎。       相应地,出海的难度和它的热度一样居高不下,关税壁垒、文化鸿沟、认知短板、供应链重塑……每重障碍都等着我们去跨越。       之所以说当下是全球化2.0时代,是因为当前的全球化是中国前所未见的。       过去的全球化,中国站在主场,外资企业来到中国发展,来适应中国的文化和规则,我们做的只是去提高技术能力。而当下的全球化,中国必须去到客场,原本不曾注意的文化问题、劳动力问题都会陆续展现出来。出海本质上是改变企业性质,从中国的本土企业真正变成一个跨国企业,这次全球化的尽头是本土化。       中国企业在做出海决策时,需要从战略上谨慎考虑。出海不是简单的规避风险、降低成本,不是国内市场卷所以要往外走,而是要真正成为一个全球化企业,在本地化的过程中获取最大的价值源泉。我们至少需要用十年的时间周期来考量,而不是以一两年的战略调整以应对当下的风险变化。       2025年可能是中国企业出海的战略认知的分水岭。从战略层面上,中国企业都开始认认真真思考出海中的问题,但在落实的过程中又会呈现出各式各样的阶段性特征。可以对这次出海下一个基本判断:这次大规模群体性出海,多少有点仓促,且带有很强的目的性。       中国制造业从未经历如此大密度的全球出征。从手机、电视到汽车、园林割草机等,各行各业都在向外走,供应链则覆盖彻底,上下游企业一起移动。随便一个看似简单的产品,都有可能牵动数十家乃至上百家企业。       仓促性也同样明显。2018年美国对中国产品加征关税引发了大量代工厂迁移,2022年开始,中间零部件的工厂也加速移动。中国从“制造力为中心”到“设计力驱动”的切换周期还没有来得及完成,全球制造业的洪流已经驶入了新阶段,大量企业没有做好足够的准备,这就要求企业要在出海中形成能力。       这也是一次有很强目的性的出海,无论是被动的配套商还是主动的品牌商,都感受到了一种出海的拉力。       与此同时,“逆全球化”的声音也从四处传来。全球供应链的脆弱和断裂被反复强调,全球化的进程似乎阻力重重。然而这只是站在中国看中国,如果以真正全球化的眼光来看,就会发现全球范围内,新增工厂在不断出现。全球化没有减速,甚至在局部加速,中国工厂,俨然成了各个国家争抢的对象。       今年出海的最大不确定性,来自特朗普的再上台。       2024年中国的贸易顺差达到了创历史纪录的近万亿美元,某种程度上来说,中国产品的出口已经成为全球的“眼中钉”,但中国工厂又是这次全球制造业格局变化中各个国家都喜欢的“心头肉”。巨大的反差就决定了这轮出海的本质,在于中国不得不将更多的产能,在全球范围内进行重新分布,而特朗普不过是影响这次分布中最显性的因素之一。       美国政府将关税看成一种威力无边的武器,对中国加征10%关税,对墨西哥和加拿大征收25%关税。特朗普无非想要解决两个问题:一,把制造业都留在美国本土生产,二,解决高通胀问题。但这两个问题很难同时解决,需要借助墨西哥、加拿大,包括中国的帮助。       然而美国制造业正在发生结构性的退化,很多制造能力已经无法再重新生成。关税威胁,反而提高了美国经济中出现负反馈循环的概率。       征税是对本国产业的一种交代,政治意义远大于恢复产业竞争力所需要的激励。关税工具并不能帮助美国制造能力强大起来,也未必能削弱中国制造能力,但它造成了另外一个结果,即对全球工业化的空间分层进行了搅拌。       在全球化1.0体系中,中国成为全球制造的枢纽,大量供应链在中国本土完成了连接,完成了货物的吞吐。全球化2.0体系是将供应链进行全球分散重组,我们不能错失这轮格局重塑中关键的卡位时间点。       如何在这次全球制造业流动的格局中生存下来?关税贸易政策是出海的外部刺激因素,中国企业需要从内部完成价值的重生,完成与全球价值链的缠绕。       上升到更高层面看,企业在全球布局时,需要有大型企业作为链主参与,这种“龙头效应”非常重要。目前的中国出海企业,多是生产成品中的一个组件,单打独斗居多。如果没有链主企业出海,上游供应链出海将非常艰难。有了链主的牵引,供应链能力才能横向扩展,企业业务也更加多元化,形成一定的协同效应,别的中小企业也会被拉进全球化的快速轨道之中。       通常情况下,评估一个企业适不适合出海,可以通过两个30%模型来判断。       第一,海外收入占比超过30%。30%的海外收入,是一家企业财务模型是否健康的重要标准之一。目前中国5000多家上市企业,整体海外收入占比大概是11%左右,如果都是通过贴牌来完成的,那依然远远不够。       第二,海外产能占比超过30%。这不仅仅对企业是一个挑战,对中国制造业的变迁也是一个巨大的挑战。       两个30%是在评估企业怎样去建立国际化的能力,员工是否具备全球化视野,能否建立一个适用于海外的财务指标体系?只有把这些问题都梳理清楚了,才是一个真出海的企业。       “真出海”是企业构建了一种长期扎根海外的生存能力,而“假出海”是出于成本与风险考量的现实主义者。比如,一家大多在做贴牌的公司,绝大部分收入都来自于海外。但是当它决定在海外建立工厂时,会发现不具备国际化的人才,因为贴牌生产,只需要按照图纸,做好精益管理就足够了。它完成了出海的业务分布,但战略认知和人才培养离真出海还差得远。       企业能否围绕地理空间、认知空间和价值链空间这三个维度考量,是真假出海的分界线。       首先考虑的就是去哪一个国家。企业需要在不同的国家和地区有实体公司落地,而工厂、物流中心等资产则是基本配置。如果没有法人公司的落地,没有广泛的组织动员,没有精心筹划的工厂,那么这种出海基本还是销售驱动型。2018年以后,确定工...

  • 2025

    02-28

    2025年外贸人来接8大机遇!

        全球经济格局深度调整、波动冲击不断,中国的经济与外贸也站在了关键的十字路口。如何应对世界格局变化,找准我们的独特优势,从而找到出路?这是每一个外贸人都在关心的话题。     目前中国在全球市场中的出口份额占比已达到15%,进口占比约为11%。2023年很难,2024年更难,但中国的经济和贸易表现还是克服了重重困难,达到了预期目标。     展望2025年及以后,经济发展将面临诸多不确定性,尤其来自外部环境。目前最受关注的问题是特朗普新政府的政策走向,其政策调整不仅影响美国,还将对全球经济和中国经济产生深远影响。虽然特朗普政府的关税政策朝令夕改,但无论如何变化,对中国出口产品征税只是时间、方式和税率的问题,此外还可能涉及税收以外的综合性政策措施。     例如美国可能取消对中国的最惠国待遇,意味着美国将重新对中国贸易政策进行年度审核,有可能每年的政策都完全不同,这对外贸企业而言就具备很强的不确定性。     第二就是增加关税。这会影响我们的外贸、出口和进口,而且会影响中国的产业发展,影响中国利用外资对外直接投资,甚至引发中国国内产业的空心化等一系列问题。     此外301调查、出口管制、汇率风险等等,都是外贸人需要面对的一系列挑战。在这样的背景下,担心不可避免,但我们更需要回归理性认知。     回溯2001年,中国加入WTO之时,对我们的企业能否抗衡国际巨头也有类似的忧虑,但历史给了我们足以自豪的答案。     当前,中国正经历“二次开放”的关键转型,在国内外的严峻压力下,中国的经济会再次再改革、再开放,从以前的规模向质量发展。     比如整个外贸依存度,目前大概是30%,很多省特别是经济强省的外贸依存度更高,从这个角度看,中国经济发展的支撑力量就是涉外经济。在此背景下,不管外部环境如何艰难,都不能放弃涉外经济,这是所有国家政策目前立足的观点。     现在面临的问题是,在外部环境不好的条件下,中国的涉外经济怎么办?     如何更高质量地对外开放,让中国二次达到加入WTO的效果,不仅是中国经济继续强大,而且是从量到质发生根本性的变化,通过外部的因素来倒逼国内经济的改革,之后达到我们想要的结果。     就当下来看,我们至少拥有这么几项优势,或者说是机遇。     首先,中国外贸在国际优势独特。中国拥有全球最完善的工业体系,“中国制造”敢与发达国家比性价比,与发展中国家比质量。     第二,网络时代,消费者最重要。消费者有两个属性:路径依赖、羊群效应。网上购物,到哪个电商平台,购买哪个产品,一旦认定了就不会轻易变;哪个亲友买了什么东西特别好,也会带动身边一群人去搜索看看。加上中国产品价廉物美的特点,保障了在海外市场消费者心中的地位,确保了消费黏性以及扩展宣传效果、示范效应。     第三,整个世界经济下行期间,消费降级成风,消费者以前看的是品牌溢价,现在看的是性价比、个性化,正好迎合目前中国生产企业小规模定制的特点。     第四,不管外部环境怎么变,中国外贸经过四五十年的发展,已积累了大量国际经验,企业主对国际市场变化的嗅觉特别灵敏,关键时刻,还是要让经验说话。     第五,国内经验可用于开拓国际市场,这个优势可以说也是我们的独一份。中国地大物博、人口众多,地区文化差异大,很多产品在不同省份得到的待遇迥然不同。在国内能做到一定体量的企业、销到一定数量的商品,都已在不同省份、不同城市经历过千锤百炼。企业如果以前没有出口,现在准备做出口,在国内积累的经验对于开拓国际市场具有核心竞争力,在竞争中会表现出很强的韧性。     第六,现下是内外贸一体化时代。商务部重点在做的就是内外贸一体化。以前出口是出口,进口是进口,标准不一样,规则不一致,监管也不一致。这对传统外贸企业而言是个痛点,成本很高。现在政府着力要打通这一点,让同一款产品既可以在国内销售也可以在国外销售,释放中国企业的商机。以前纯做外贸的也可以在国内做,以前纯做内贸的现在也可以直接做外贸,降低开拓国内贸易和国际贸易的门槛,让越来越多的企业能够同时从事内外贸,统一国内大市场,城市之间、省际之间的贸易壁垒、行政壁垒等各种成本都会下降。     2024年中国从事外贸企业的数量创历史新高,2025年内外贸一体化之后,国内的很多商家、小店主可能会同时在跨境电商平台做小店主,开始拓展国际贸易,成为外贸增长稳定的新力量。     第七,国家的外贸支撑政策。现在国家在针对整个外贸流程降低成本,最优化、便利化,比如海关流程,实行全面的简化、降负。与此同时,在生产环节,国家也在帮助企业做一些事情,让中国外贸具有更强大的优势和韧性。     第八,中国外贸的韧性,还很大程度上依赖跨境电商的发展。在跨境电商方面,近十年国家进行战略性布局,做了很多事情,跨境电商已成为今后中国外贸发展的重要方向和支撑力量。     阿里国际站、Shein、Temu等平台以及独立站模式目前都很成熟,在传统贸易保持不变的条件下,通过跨境电商可以更多占据世界各国的市场,帮助中小企业直接触达海外消费者。     整个跨境电商重塑了生产模式和贸易模式,这是跨时代的成就。成本的下降让很多以前够不到门槛的中小型企业家、小店主,现在也可以从事国际贸易,有了机遇就可以做到遥遥领先。跨境电商的存在,降低了信息壁垒或摩擦,让企业可以获得更多信息,去知道世界是什么,需要什么,从而调整自己的战略,让自己更加与时俱进,走在行业的最前端。     跨境电商不仅能帮大家“上桌”,还能帮大家“吃好”。要高质量发展就要有自主品牌,有了自主品牌才能提高企业的盈利率,有了钱才能做研发,实现良性循环。跨境电商的存在,让自主品牌也成为可能。     以前如果不进入这个平台,机会就是零,现在这里能释放很多企业的聪明才智,释放很多企业家的才能,这是中国整体外贸持续前进的动力。     很多出海人都有个明显的感觉,2025年或将成为新时代和旧时代的分界点。虽然前两年已经是AI的时代,但当时大家的感觉都是,中国还处于跟随状态。自从年初DeepSeek出现后,我们才感觉自己终于也成为了主战场的一部分。     客观地说,DeepSeek并不能直接地帮大家多赚钱,但通过便捷使用DeepSeek,不需要担心中文表达不被理解,它对中文...

  • 2025

    02-20

    有了DeepSeek,我们的期待会实现吗?

        DeepSeek风头无两,截至2月14日,A股市场就已有98家上市公司宣布接入DeepSeek大模型。     2月15日深夜,微信通过灰度测试,在AI搜索中接入了DeepSeek R1大模型。部分微信用户发现,点开微信搜索框会进入“AI搜索”页面,可在“问AI”入口,找到“快速回答”、“深度思考”两个选择。其中“深度思考”就由DeepSeek R1提供服务,经过长思考,提供更全面的回答,且在使用过程中会展示思考推理的流程,和独立的DeepSeek App并无二致。     微信只是个合作开始,接下来其他腾讯系产品还会逐步接入DeepSeek。这一合作消息,让腾讯在港股市场一度大涨超过7%,股价突破500港元,创下自2021年7月以来的新高。2月17日上午,“腾讯市值暴涨3000亿”的话题冲上热搜,最终,腾讯以上涨4.30%、495.20港元/股收盘。     截至2月17日,包括元宝、微信、腾讯文档、QQ浏览器、QQ音乐、腾讯地图等应用在内,腾讯旗下至少15款产品已经宣布接入DeepSeek大模型。这是国内第一家有自己大模型的互联网大厂宣布接入DeepSeek,也是第一家选择在当家产品里接入其他大模型的大厂。     得益于DeepSeek引发的鲶鱼效应,2025年大模型行业能力将有明显提升。互联网厂商在AI领域的竞争,也将由技术之争转为生态之争、应用之争。     而在DeepSeek的加持下,拥有最庞大用户基础和丰富AI应用场景的腾讯,无疑将打开更多想象空间,或将成为资本市场重估中国资产的核心标的。     腾讯的核心竞争力一直在它庞大的生态系统,而非单一的技术能力。与其说腾讯是技术主导者,说它是生态整合者更为准确。 在近两年科技大厂争夺大模型的混战中,腾讯展现出的危机感并不强。与Kimi、豆包等的高举高打不同,腾讯在AI应用上投放、招揽用户的节奏显得没那么激进。至2024年5月,腾讯元宝才姗姗来迟。     All in AI时代,相较于其他互联网大厂的快速推进,腾讯的混元大模型虽有一定技术积累,但在技术优势和推理能力上尚未达到行业领先水平,随时面临“掉队”风险。可喜的是,DeepSeek R1与混元模型具有较强技术互补性。DeepSeek R1在长文本推理和复杂逻辑推演上有优势,能弥补混元模型在即时性问答之外的短板。通过接入DeepSeek,腾讯除了能够以较低成本快速补齐AI能力,同时还能将资源集中在自身优势领域,如生态整合、场景落地等等。     不着急,源于有底气。腾讯拥有微信这样级别的国民产品托底,自身积淀了强大的产品力和用户基数,可以等局面明朗时再入局。     微信这一超级入口,覆盖了社交、支付、内容、游戏等多个场景,这种生态优势使其无需急于推出自研大模型,而是可以通过外部合作快速验证AI技术的实用性。     从早期卷参数、卷算力,再从卷大模型变成卷应用,AI是一场马拉松,以生态优势对冲技术代差,选择接入已验证的优质模型,也能避免陷入军备竞赛,让AI普惠真正成为可能。当DeepSeek爆火,大模型竞争开始走向阶段性尘埃落定时,腾讯便成为了大厂中转身最快的一家。     2月12日,元宝App宣布接入DeepSeek R1;2月15日,微信开启灰度测试。从目前的体验上看,微信的AI搜索还比较轻量级,不支持连续对话,也不支持辅助提问与搜索,且退出聊天界面后,当前的对话记忆内容也会被直接销毁。     腾讯苦搜索久矣。     早在2014年6月,微信就推出了搜索功能,不过最初功能十分单一,仅可查找聊天记录。此后几年,随着微信生态逐渐繁荣,微信搜索的能力边界也不断拓宽,公众号文章、小程序、表情、短视频等内容都被纳入进来。为增强用户对搜索功能的认知,2017年5月,微信正式上线“搜一搜”入口。     作为互联网行业历史最悠久的业务之一,由于用户指向非常明确,搜索的商业模式清晰且高效。腾讯并非不想分一杯羹,但在国内,百度的壁垒很高,而突然爆火的AI大模型,为搜索行业带来了全新的解题思路。大模型加持的AI搜索,可以通过AI技术理解用户意图,高效梳理全网海量信息,进而生成准确的内容,有效规避传统搜索广告多、信息杂等痛点。     AI搜索的能力,与基座模型的规模成正比。此前,互联网巨头只需深耕闭源模型,提高模型的材料分析和推理能力,即可在AI搜索领域构筑深厚的护城河。     DeepSeek横空出世,很大程度上拉齐了AI搜索产品的底层能力。对腾讯而言,虽然在底层技术上与其他产品高度趋同,但微信作为国民社交软件,借助独特的公众号、视频号、小程序等内容生态优势,微信AI搜索或将极大地拓宽AI搜索反馈的内容维度,构筑闭环的生态体验:从搜索信息出发,以购买商品、服务或者解决方案为终点。     这对微信内容生态是一个很大利好,可以大大激活历史内容,2000多万公众号的旧文可以通过AI搜索推荐重新在社交链中流通,甚至开启公众号生态的第二春。     公众号这个中文互联网生态优质内容最为集中的平台,对近14亿用户来说无需学习就能享受AI的红利,这可能是覆盖面最大的科技普惠。未来如果实现检索增强生成(RAG)与微信内容的结合,AI搜索将不再只是工具,而是连接用户与生态的神经中枢。     这就意味着,我们期待已久的AI助手,真正能看到曙光了。     在DeepSeek加持下,微信完全可能进化成“场景化AGI”,独有的“数据-服务-社交”闭环能力,让AI有可能同时调用公众号专业内容(文献检索)、小程序服务接口(机酒预订)、视频号场景化展示(产品测评)、社群关系链(裂变传播)等等资源。     查找内容,都无需跳出微信,即可完成“提问-获取答案-社交分享”全流程,满足即时需求(如旅行攻略、工作资料查询后直接分享给好友)。比如询问“如何预约故宫门票?”如果微信AI搜索后续能直接在回答中加入故宫博物院的小程序链接,那么用户就能一键完成预约。再比如搜索“季度财报模板”,直接跳转腾讯文档智能生成,基于小程序、视频号、微信小店等模块,还能孕育出大量的可能。     这与张小龙的系统思维很相似:技术必须服务于生态整体,而非割裂为独立功能。微信的目标是做一个连接世界的工具,从而自发生长出一个系统。真正的AI手机,就应该只是一个语音命令,然后AI助手便横跨多个App进行自动操作。自动订票、自动订餐,自动下单快递等等,都不在话下。如解...

  • 2025

    02-14

    从DeepSeek爆火,看透未来四大趋势

    DeepSeek强势打破中外AI大模型竞技场原有的规则,被称为“神秘的东方力量”,它的出现,仿佛逐渐为AI的落地应用勾勒出了一个确定性的未来蓝图,悄然拉开产业数智化的大幕。从中,我们可以窥见未来AI大模型产业发展的四大趋势。 一,模型迈进高性价比时刻。 这几年,AI大模型的入场门槛居高不下。上万亿的参数规模、超强的算力支撑以及海量、优质的数据资源,都意味着高昂的入场价格。 以GPT-4为例,其训练数据量高达13万亿token,涵盖了互联网全领域的文本。如此海量的数据标注工作不仅成本高昂,而且耗时费力,对算力的需求也极为庞大,依赖数万张A100 GPU集群,单次训练成本即超过1亿美元。高昂的成本和资源需求使其技术很难落地,更可怕的是烧钱未必能换来前景。 DeepSeek的最亮眼之处也恰在此,即其可以通过纯强化学习(RL)实现“自我进化”,使其在数据准备方面具有显著优势。无需标注数据,就大大降低了数据准备的成本和难度,为开发者节省了大量时间精力,让他们能够更加专注于模型的训练和优化。 同时DeepSeek的奖励设计极简,仅用“答案正确性”和“格式规范”作为奖励信号。简洁的奖励机制避免了复杂奖励模型可能导致的作弊风险,使模型训练更为高效、稳定,还能够更好地引导模型朝正确的方向发展,提高模型的训练效果,避免一些意想不到的情况导致偏差。 此外,DeepSeek采用GRPO算法,用组评分替代传统Critic模型,算力消耗降低30%以上,进一步降低了对硬件资源的需求,也就是俗称的对“卡”的依赖,且模型能力也并未因算力的降低而大打折扣。 从成本侧来看,DeepSeek提供了一种更为适配AI落地的低门槛、低成本方式。对中大企业乃至央国企而言,可以用更低的成本进行大模型项目的部署,或者把重点更多地转移到数据治理环节,进一步提高最终的模型效果。小型科技公司也同样受益,以往囿于资金、技术无法涉足的AI领域,现在已开启了可能。企业可以利用相对较低的成本,基于DeepSeek开发出适合自己业务需求的AI应用,推动公司业务的发展和创新。随着强化学习(RL)技术范式的变革,更多企业和开发者得到了参与AI创新的机会。 第二,因为开源加速,属于垂直小模型的春天来了。 跨维度知识蒸馏体系的构建是DeepSeek的另一大亮点。一组数据显示,DeepSeek-R1-Distill-Qwen-7B在AIME 2024评测中以55.5%的得分超越原版QwQ-32B-Preview,在参数规模缩减81%的情况下,性能提升了23%。其32B版本更在MATH-500测试中达到94.3%的惊人准确率,较传统训练方法提升近40个百分点。 这是通过将32B大模型的推理逻辑解构为可迁移的认知模式,再经由动态权重分配机制注入到7B小模型中,实现了“思维范式”而非单纯“知识记忆”的传递,用传统文化的概念来表述,即由“术”入“道”,触及到发展本质,提供了更高层次的理念。 在这种技术路径下,小模型不仅继承了大模型的解题能力,更习得了问题拆解、逻辑推演的元能力。这也意味着⼤型模型的推理模式可以蒸馏到⼩型模型中,其性能优于直接在⼩模型上强化训练的结果。这显然打破了我们“模型越大,性能越强”的固有认知。 随着这种“蒸馏+强化学习”的复合训练方式的出现,小模型的春天似乎要来了。中小型企业和垂直领域专业企业可以显著减少在硬件设备采购和租赁上的⽀出,同时降低能源消耗成本。 在⼩模型有效性的趋势下,拥有⾏业认知的企业通常对自身业务流程和数据特点有深刻理解,往往能够更快速地将模型集成到现有业务系统中,让专业能力提升模型含金量,在AI领域实现快速超车,成为垂直赛道AI规则的制定者和引领者。 第三,端侧应用即将进入爆发期。 DeepSeek的出现将引起新一轮的终端应用爆发,为各行业的数字化转型和升级提供有力的技术支撑。 受硬件算力所限,之前在手机端、可穿戴设备端等很难运行大型AI模型,从而限制了AI技术在这些领域的应用,而在实时决策场景中,AI需求的满足还存在很大缺口。 DeepSeek通过模型压缩技术,使其优化后的模型可以更好地适应资源有限的设备,这使得边缘计算设备能够具备更强的AI能力,为用户提供更加便捷、智能的体验。例如在智能眼镜中,DeepSeek可以实现更快速、更准确的图像识别和语音交互功能,用户可以通过智能眼镜高效获取信息、进行导航、识别物体等,大大提升了智能眼镜的实用性和应用场景。 在实时决策场景方面,高效推理能力能发挥重要作用。以金融交易为例,金融机构需要在极短的时间内对大量的市场数据进行分析和处理,以做出准确的投资决策。DeepSeek能够快速地对数据进行分析和预测,为金融交易提供实时的决策支持,帮助金融机构提高交易效率和盈利能力。 用更低的成本应对相同的AI请求,或用相同的成本应对更多AI请求,意味着使用AI的成本还会进一步下降,真正意义上让AI无处不在,可穿戴设备将会是AI普惠的重要切口。 第四,DeepSeek带来了AI生态上的变革,为AI落地产业促生更多可能性。 当前AI产业呈现出一种金字塔结构,OpenAI、谷歌等巨头把控基础模型,中层企业依赖API调用,陷入数据空心化,底层中小开发者失去了主动性,沦为生态附庸。这种结构的致命缺陷是创新停滞,巨头为维持垄断,必然限制模型开放度。 而DeepSeek开源了核心模型,开放了API定制能力,打破了以往巨头们主导的金字塔式生态。 在新的生态模式下,大厂小厂都能找到自己适合的角色。大厂可以专注于炼模型,利用强大的技术实力和资源优势不断优化提升模型的性能和能力。中小厂则可以专注做应用,基于开源模型快速开发专用AI工具,无需依赖巨头提供“黑箱”能力,充分发挥自身的灵活性和创新能力,开发出更加贴近用户需求和行业特点的AI应用,从而获取更多的发展空间和机会。 这种生态变革还带来了技术民主化、生态正循环和场景定制化等多方面的好处,不仅为AI产业的发展带来新机遇,也为各行业的数字化转型和升级提供了新的动力。 开源核心框架,吸引开发者积极参与生态建设,汇聚各方的智慧和资源,能形成强大的技术合力。另一方面,联合芯片厂商、云服务商以及垂直领域的专业企业,形成“算力—模型—场景”的铁三角合作模式,能够促进产业链上下游的协同创新,打造一个合作共赢的产业生态环境。 从当前的行业形势来看,尽管中国AI大模型在通用能力上暂时难以全面超越 OpenAI,但通过在垂直场景中的深耕细作以及生态的开放合作,完全有机会实现差异化突围,走出一条独特的“小而美”之路,通过在特定行业的深入应用和优化,逐步向通用智能领域渗透和拓展。 这一发展路径不仅能够充分发挥中国在特定领域的产业优势,还能够为全球AI产业的发展提供一种具有中国特色的创新模式和解决方案,推动AI技术的多元化发展和应用。 相关链接:中国区支持的其他支付方式名单 shopify的套餐费用明细...

  • 2025

    02-07

    DeepSeek:从打破规则,到成为规则

        这个春节,无论你是不是科技爱好者,大概率都逃不过关于DeepSeek的资讯刷屏。     除夕前夜,DeepSeek在中国区和美国区苹果App Store免费榜上同时冲到了下载量第一,这是国产App史无前例的佳绩,更是在全球范围内,首次有产品超越OpenAI的ChatGPT。     此前,深度求索宣布其推出的DeepSeek-V3仅花费558万美元,不到国外公司十分之一的GPU芯片和训练时长,就实现了与GPT-4o和Claude Sonnet 3.5等花费数亿美元训练的顶尖模型相当的性能。1月20日,深度求索推出推理模型DeepSeek-R1,仅用OpenAI十分之一的成本就达到其最新模型GPT-o1同级别的表现。这个消息,不啻于在科技界投下一枚重磅炸弹。     自从AI竞赛存在以来,这是第一次,焦虑给到美国科技公司。中国互联网和科技公司的角色始终是追随者,只能寄希望于用更多的资源投入追赶对手,但风向由OpenAI、Meta为代表的美国公司牢牢掌握。2022年起,美国政府宣布升级芯片出口管制,此后多次更新出口限制清单,限制高算力芯片出口,中国AI企业普遍陷入算力焦虑。     DeepSeek最新模型的出现,打破了大模型发展沦为巨头与资本游戏的行业共识,为业内追赶美国大模型的中国公司们提供一条新的思路,向业界证明了可以把大语言模型的训练成本降低1到2个数量级。业界此前普遍认为的训练成本是1亿美元甚至更多,说这是一场“军备竞赛”并不为过。几百万美元,令下场逐鹿者的门槛低了很多。现在比拼的,不再只是GPU数量,更应考虑的是哪个团队具备技术和产品上的创新能力。     相比OpenAI和它的中国效仿者们用数亿美元训练大模型,DeepSeek选择了一条更抠门也更极致的路线。     研究人员提出的一种新的MLA(多头潜在注意力机制)架构,与DeepSeek MoESparse (混合专家结构)结合,把显存占用降到了其他大模型最常用的MHA架构的5%-13%。     行业通常用数万亿token(文本单位)训练模型,但DeepSeek通过“数据蒸馏”技术,即用一个高精度的通用大模型当老师,而不是用题海战术来更高效训练学生“模型”,把数据计算最大程度降低,仅用1/5的数据量达到同等效果,促成了成本的下降。     一个通俗的举例可帮助我们理解这种变化:传统大模型每次处理问题都需激活全部参数,而普通用户提出的问题一般并不需要如此大的资源投入,这如同让一家医院的全部科室去会诊一个普通感冒;而DeepSeek-R1会先判断问题类型,再精准调用对应模块——数学题交给逻辑推理单元,写诗则由文学模块处理。这种设计让模型响应速度提升3倍,能耗也更低。     更快速度和更低能耗,建立在“低成本、高性能”的初始规划上。DeepSeek通过算法优化显著降低训练成本。R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成。此前,OpenAI等企业训练模型,都需要数千甚至上万块高算力的A100、H100等顶级显卡,花费数亿美元的训练成本。     当资源受到限制时,往往会激发创新,而资源过于充沛,创新却未必会如期而来。DeepSeek的出现是又一力证。     DeepSeek选择从垂直场景切入,从all in特定领域开始,追求在部分领域(如数学、代码)的表现更优,再逐步分阶段完善其他领域的能力。     这种另辟蹊径也意味着更高难度,更高风险。若路由错误(例如将诗歌创作误判为数学题),输出质量将会暴跌;模块间的知识隔离(如用数学公式写情书),可能导致跨领域任务失败。如果未能开发出足够优异的模块化模型,前期的投入可能浪费。大多数公司受限于路径依赖或资源约束,难以接受all in这一高风险路线。能把这个极致的路线走通,勇气与能力缺一不可。     早期DeepSeek的MoE模型误判率普遍在15%以上,团队通过引入强化学习优化路由决策,长期训练后模型在测试中将误判率控制在个位数的低位。多位行业人士将DeepSeek的脱颖而出理解为“模块化特种兵”,在与OpenAI等“通用巨兽”的比赛中,在部分领域展现出同等能力甚至略微领先。尽管DeepSeek的整体技术与OpenAI等美国企业存在差距,但其已经足以被视为一个实力逐渐接近的竞争对手。     DeepSeek引起轰动,除了模型本身的优异表现,还来自其坚持的免费开源主张,公开模型的源代码、权重和架构。无论是个人、开发者,还是企业用户,都可以免费使用其最新模型,并在此基础上开发更多应用,这也出于DeepSeek对自身发展情况的考量。通过开源策略,可以快速建立生态,获得更多用户和开发者支持。     在DeepSeek创始人梁文锋看来,DeepSeek未来可以只负责基础模型和前沿创新,其他公司在DeepSeek的基础上构建To B、To C的业务,如果能形成完整的产业上下游,就没必要自己做应用。     DeepSeek的模块化模型设计,如同精密的钟表——单个齿轮的工艺或许可复制,但整体协同需要长期试错与生态积累。竞争对手并不能依靠简单照搬就能复制其原始模型,越多用户和开发者使用,就意味着模型得到更多训练。     DeepSeek在引发科技界巨震同时,也引爆了价格战。日前,OpenAI发布了全新的o3大模型,免费对外开放。上周微软也向所有的Copilot用户免费发布了o1推理模型。     北京时间2月6日凌晨,OpenAI宣布向所有用户开放ChatGPT搜索功能,且无需注册。使用界面很简单,打开“搜索”按钮就行,旁边的“推理”选择是否展示整个推理过程。     谷歌DeepMind的Gemini 2.0系列全家桶也终于正式上新,不仅在性能上有进一步的提升,还挥舞起AI性价比的大旗,同时拥抱多模态能力。     Gemini 2.0 Flash支持多模态输入和文本输出,具备100万tokens的上下文窗口,并支持结构化输出、函数调用和代码执行等功能。定价方案也已确定,文本、图像和视频输入每百万tokens收费0.10美元,音频输入则为0.70美元(2月20日起正式生效)。文本输出每百万tokens收费0.40美元。轻量版Gemini 2.0 Flash-Lite的文本、图像和视频输入每百万tokens仅需0.075美元,几乎比标准版便宜了三分之一。音频输入也为0.075美元,文本输出为0.3...

1 2 3 4 5 ... 9
[  共  9  页]
在线留言 在线留言
如果您对我们的产品感兴趣并想了解更多详情,请在此留言,我们会尽快回复您。