图片来源:视觉中国
蓝鲸新闻12月30日讯(记者 朱俊熹)ChatGPT发布两年以来,AI浪潮继续奔涌。这一年,“卖铲人”英伟达依然是最大受益者,一度成为全球市值最高的公司。凭借Apple Intelligence的叙事,苹果年底市值逼近4万亿美元的历史性关口。行业领军者OpenAI也以千亿估值跃升为全球第三大独角兽。
无论国内外,科技公司或喊出“AII in AI”的口号,或在战略版图中继续扩大AI的地位。在公开活动、公司财报中,AI已成为不可或缺的主题。科技行业之外,更多的公司着手将其与自身业务结合。对个体来说,人们开始习惯在生活中随时打开AI对话助手,和人工智能交流各种天马行空的想法。
2024年,AI技术继续向前迈进,行业加速洗牌,同时也留下了一些悬而未决的问题。
Scaling Law遭遇瓶颈如何突破?
当回顾ChatGPT何以成功掀起AI热潮时,一个共识是受到了数据、算法、算力三架马车的驱动。2020年,OpenAI研究团队提出,随着模型规模、训练数据集和计算资源的增加,模型性能也将持续提升。这就是指导模型预训练的关键法则Scaling Law,在过去几年间推动了大模型的飞跃。
但今年下半年以来,对Scaling Law是否撞墙、边际效益递减的争论愈演愈烈。先是OpenAI迟迟未亮相的下一代大模型GPT-5被传训练受阻,即使投入了巨大成本,模型的进步却在放缓,未能实现从GPT-3.5到GPT-4的跃升程度。随后,谷歌、Anthropic等多家公司也被曝面临类似的困境,不得不延后旗舰模型的发布,寻求新的技术路线。
代替GPT-5,OpenAI在9月释出了推理模型o1,并在三个月后发布继任者o3模型。该系列模型采取不同于GPT序列的命名规则,也被普遍视为新范式的开始。推理模型将更多的计算资源投入到推理阶段而非预训练阶段,通过增加强化学习和思考时间,实现模型性能的提升。
在AI行业看来,推理模型有望成为预训练scaling放缓的解法。国内大模型独角兽月之暗面创始人杨植麟曾公开表示,o1模型的意义在于提升了AI的上限。当原先的Scaling Law因互联网优质数据的耗尽而遭遇瓶颈,它至少证明了通过强化学习和大语言模型的结合,能够实现进一步的scaling,“完全有可能是一个很重要的开端”。
由此,国内外大模型玩家也开启了转向推理范式、继续追赶OpenAI之路。截至2024年底,谷歌已推出首个推理模型Gemini 2.0 Flash Thinking。其首席科学家Jeff Dean称,该模型经过训练能够利用思维过程来增强推理能力,“当增加推理时间计算时,取得了令人鼓舞的结果!”
国内现已具备可媲美o1的推理模型,包括幻方量化旗下DeepSeek的R1-Lite预览版、阿里通义的QwQ模型。近期,月之暗面先后发布数学模型k0-math、升级版视觉思考模型k1,在数理化等特定能力上表现优于o1。另有字节跳动等厂商透露正在布局推理模型方面,预计明年将会迎来更多此类模型的面世。
尽管各家公司对推理模型这一进化方向展现出一定的共识,但其现有使用场景仍极其有限。在回答用户提问时,推理模型需要花费更多的思考时间。OpenAI研究人员在o1模型发布时就曾坦言,o1模型并不总是比GPT-4o好,对于许多不需要推理的任务,有时等待o1的回复不如直接快速获得GPT-4o的响应。
与传统的大语言模型相比,推理模型的开发成本更低,但使用时的推理成本大幅增加。OpenAI将部分成本转嫁到用户侧,完整版o1模型的访问权限被纳入新推出的付费套餐ChatGPT Pro中,定价则由基本套餐的20美元/月升至200美元/月。而o3模型虽然在基准测试中的得分远超o1,高计算模式下完成单个任务就需要承担数千美元的昂贵成本。
目前看来,对普通用户而言,推理模型的可用之处尚不明显。硅谷科技媒体The Information曾援引知情人士说法称,只有一小部分ChatGPT用户会定期使用o1-preview。这类模型似乎更有助于科研人员群体,这也是OpenAI重点瞄准的目标人群。
承载商业愿景的AI超级应用会到来吗?
相较于一年前市场的如火如荼,今年AI热潮已开始经历周期性的冷却。当科技巨头们继续鼓吹要大幅投入AI、追求长期回报的策略时,AI泡沫论的质疑也在蔓延。更现实的问题是,承受着高昂的研发成本,大模型厂商们为了生存也要找到可行的商业路径。
大模型转向落地的趋势,直接体现在各家公司推广话术的变化中。比起单纯地以大模型性能、参数、跑分论优劣,更注重展示模型的应用落地场景。
为抢占早期市场,一场“价格战”爆发了。今年5月,DeepSeek、另一创企智谱AI率先降低旗下模型的调用价格。随后字节跳动在发布其豆包大模型时打出最响一炮,主力模型价格较行业便宜99.3%。在此之后,原先持谨慎态度的阿里云、百度、腾讯云也纷纷宣布跟进降价,大模型由以分定价进入以厘定价的阶段。
在此轮价格战中,攻势猛烈的大多是国内云厂商,AI创企鲜有参与。云厂商们希望能通过亮出模型降价的招牌,吸引更多客户使用其云服务。降价带来的短期损失能够从云服务受益中再补贴回来,还能进一步扩大其公有云市场份额。
数据显示,这样的获客手段确是有效的。据各公司最新披露,字节豆包通用模型的日均tokens使用量已超过4万亿,较七个月前首次发布时增长了33倍,百度文心大模型日均调用量达15亿次。百度创始人李彦宏曾表示,如果API调用量能在一年内上涨10倍至20亿,代表大模型算是“成了”。
受成本降低和模型进化的推动,AI应用也开始涌现。ChatGPT式的AI对话助手成为各家“标配”,包括字节豆包、月之暗面Kimi、腾讯元宝等。但据36氪此前报道,字节管理层认为即使是处于国内第一梯队的豆包,在对话轮次、时长等关键指标上的表现依然不够理想。因此判断AI对话类产品可能只是AI产品的“中间态”,并提升了AI创作平台即梦的优先级。
可自主感知环境、执行行动并完成设定目标的智能体,成为众多AI企业押注的下一个应用风口。谷歌在推出最新的Gemini 2.0大模型时,就表明是为智能体时代构建的。今年李彦宏更是反复强调,百度将智能体视为最重要的战略方向,认为智能体这一AI应用的最主流形态即将迎来爆发点。智谱AI自10月起推出多款自主智能体,能够模拟人类操作手机与电脑,展示出智能体更大的应用潜力。
AI搜索赛道的竞争也日趋白热化。不仅谷歌、百度、阿里等巨头正在积极利用AI改造传统搜索引擎,OpenAI、月之暗面等新兴创企也开始在产品中集成AI搜索功能。近期,小红书低调上线AI搜索新产品“点点”,并在App内开启了小范围内测。有AI搜索开发者曾对蓝鲸新闻表示,搜索是用户每天高频使用的场景,已然成为AI公司的兵家必争之地。
随着AI应用方向在垂直领域出现分化,同时应用层涌入了更多的新公司,明年或将看到形式更为多样的AI应用。编程、情感陪伴、智能硬件等领域呈现出蓬勃上升的态势。
市场仍在期待,AI时代何时能迎来像微信这样的超级应用。对此,行业领导者们态度不一。李彦宏称超级应用不如超级能干,智谱CEO张鹏则表示,超级应用的出现并不完全由技术驱动,还要考虑市场和用户是否准备好、需求发掘以及一点点运气。“不要过早地只看这个结论,保持一点耐心。”
大厂和创企,谁能继续留在牌桌?
临近年末,AI大模型领域的融资消息再次活跃起来。“六小龙”之一的创企阶跃星辰近期宣布完成数亿美元的B轮融资,上海国资、腾讯入股。本月中,智谱AI再获新一轮三十亿人民币融资。同为清华系、主攻端侧AI的面壁智能完成了数亿元新融资,AI视频创企爱诗科技获得近3亿元A+轮融资。
与今年上半年相比,下半年大模型公司的融资进度明显放缓。今年2月,阿里巴巴豪掷重金再投大模型创企,希望仿照微软与OpenAI的模式,以算力的形式支付部分投资。其中,阿里向月之暗面投资了约8亿美元,购入36%的股权,月之暗面完成的超10亿美元融资至今仍是国内AI领域的最大单笔融资记录。不到半月,阿里又领投另一创企MiniMax的6亿美元融资,推高其估值达25亿美元。
加上年初的投资,阿里已集齐中国最头部的五家大模型初创企业,包括零一万物、智谱AI、百川智能、月之暗面和MiniMax。阿里、腾讯等互联网的大手笔再次激起对大模型的FOMO(错失恐惧)情绪,高榕创投、高瓴资本等财务投资机构也跟投了部分独角兽。
蓝鲸新闻梳理创投数据服务商IT桔子的统计,截至12月30日,2024年国内人工智能行业共录得483条投资事件,总投资金额约为655亿元,较去年分别下滑了18.8%、6.1%。其中,今年下半年融资事件数较上半年更少,但融资金额更高。
从产业链来看,包含大模型层在内的AIGC领域在融资数量上虽仅占总数的24%,却吸走了57%的融资金额。巨额投资集中流向了月之暗面、智谱AI、百川智能等头部大模型创企。AI应用层方面,融资数量占到整体的一半以上,金额却远不及模型层。
关于AI领域的投资,金沙江创投主管合伙人朱啸虎或许能代表一派鲜明的观点:比起大模型更看好应用赛道。朱啸虎认为,基础服务最终会由云厂商提供,创业公司则会在AIGC应用端迎来大量机会。今年,他曾多次表态称,“AI 创业公司最好的结果就是卖给大厂”、“五年后将不再有独立的大模型公司存在”。
事实上,步调更快的国外AI行业已出现创业公司“卖身潮”。今年3月,微软支付6.5亿美元获得曾为OpenAI竞争对手的Inflection AI的软件授权,并聘用了其联创在内的多数员工。6月,亚马逊与AI创企Adept达成类似的交易。10月,谷歌斥资27亿美元与Character.AI进行同样的交易,后者称将放弃大模型研发,专注于改善产品。
头部基座模型厂商进一步收缩至谷歌、Meta、背靠马斯克的xAI、受微软支持的OpenAI、受亚马逊支持的Anthropic等几家公司。
而在国内,同为大厂但并未放手投资、押注自身业务的字节跳动今年表现尤为突出。虽然公认字节在大模型领域的起步要慢半拍,但其C端产品豆包的用户表现已实现反超。QuestMobile数据显示,截止10月,豆包月活跃用户数达4839万人,远超Kimi智能助手、文小言的1650万和1179万。互联网时代素以“App工厂”著称的字节还推出了十几款AI应用,覆盖了绘画、学习、视频甚至硬件产品等多品类。
在B端,对外开放字节AI技术工具的云服务平台火山引擎攻势猛烈。火山总裁谭待虽未透露公有云收入受大模型带动的具体数据,但对使用大模型的客户数量及使用程度表示肯定。谭待曾表态称,“从云原生到AI云原生,火山希望做成这块的领军企业。”
此前昆仑万维创始人周亚辉在社交平台发文称,“我年初说字节23年AI战略是不及格,但这完全不影响字节24年AI战略的满分表现。这符合我对这个组织快速迭代能力(卷死人能力)的预期。”
当大厂逐步扩大射程范围,AI独角兽关于技术和应用的细分选择也越发清晰。月之暗面、阶跃星辰专注现有的To C生产力工具,智谱AI继续探索B端商业化模式,零一万物选择在国内聚焦To B、海外To C先行。此外,MiniMax的现有优势仍在其出海战略和多模态能力上,百川智能则明确集中于医疗赛道。
凭借这一年的融资,这些创业公司至少获得了继续留在牌桌上的机会。而迈入2025年,这场大厂与创企间的AI战局将日渐胶着,或许行业会迎来新的大洗牌。谁能在AI的道路上走得更远,将成为下一阶段的悬念。