文丨猎云网 王非
2024年将是中国生成式AI应用爆发的一年!5月13日,彭博社刊登的专访文章中,李开复博士发表了上述观点。
就在几天前,零一万物刚刚官宣2C生产力应用“万知”正式提供服务,或许可以将其看作是“应用爆发”的“前戏”。
同样是在5月13日,零一万物成立一周年前夕,李开复携千亿参数Yi-Large闭源模型正式亮相,并宣布赋能2B生态的“API开放平台”全球上线。
与此同时,零一万物还公开了开源闭源双轨大模型的战略布局,李开复也在现场亲自拆解发展蓝图背后的战略思路。
针对国内大模型赛道的“大乱斗”,李开复呼吁创业者关注TC-PMF(Technology-Cost Product-Market-Fit,技术成本X产品市场契合度),拒绝ofo式烧钱打法,让大模型能够用健康良性的ROI蓄能长跑,奔赴属于中国的AI 2.0变革。
李开复认为,中国市场的AI普惠必然到来。零一万物也将结合国际经验,打造惊艳的国内AI-First应用生态。他表示,“AI-First应用的价值就是,谁会打造出AI微信、AI抖音、AI淘宝,希望我们能够成为这个点燃者。”
狂奔一年“全面上新”,开源+闭源齐头并进
2023年3月19日,李开复在朋友圈发文正式宣布,其正在亲自筹组Project Al 2.0,一个致力打造Al 2.0全新平台和Al-first生产力应用的全球化公司。
短短半年多后,零一万物于11月6日宣布首款开源大模型中英双语大模型“Yi”正式发布。稍早前,Yi在Hugging Face低调上传了两个参数规模分别为6B和34B的基础模型。
其中,零一万物所发布的Yi-34B以开源社区“甜点级”尺寸就在权威榜单中超越了Llama2-70B、Falcon-180B等大几倍的模型,成为当时世界范围内开源最强基础模型之一。
今年3月,零一万物还推出了基于全导航图的新型向量数据库笛卡尔(Descartes),其搜索内核已包揽权威榜单ANN-Benchmarks 6项数据集评测第一名。同样于3月,零一万物成功在Nvidia GPU上进行了千亿参数模型Yi-Large的端到端FP8训练和推理,成为全球率先落地该技术的三个案例之一。
持续“狂奔”近一年,零一万物于5月13日,正式发布了千亿参数规模的Yi-Large。
在最新出炉的斯坦福评测机构AlpacaEval 2.0经官方认证的模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度) 排到了世界第二,仅次于GPT-4 Turbo。Win Rate更排到了世界第一,此前国内模型中仅有Yi和Qwen曾经登上此榜单的前20。
来源:零一万物 斯坦福AlpacaEval 2.0 Verified认证模型类别,英语能力评测(2024年5月12日)
李开复表示,零一万物已启动下一代Yi-XLarge MoE模型训练,将冲击GPT-5的性能与创新性。从MMLU、GPQA、HumanEval、MATH等权威评测集中,仍在初期训练中的Yi-XLarge MoE已经与Claude-3-Opus、GPT4-0409等国际厂商的最新旗舰模型互有胜负,训练完成后的性能令人期待。
Yi-XLarge 初期训练中评测(2024年5月12日) 来源:零一万物
零一万物宣布Yi系列开源模型也迎来全面升级,Yi-1.5分为34B、9B、6B三个版本,且提供了Yi-1.5-Chat微调模型可供开发者选择。从评测数据来看,Yi-1.5系列延续了Yi系列开源模型的出色表现,数学逻辑、代码能力全面增强的同时,语言能力方面也保持了原先的高水准。
与此同时,零一万物还宣布面向国内市场一次性发布了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform英文站同步对全球开发者开放试用申请。
来源:零一万物
以开源模型构建生态,以闭源模型展开AI-First探索,开源闭源双轨模型策略使得零一万物构建起了生态体系。其中,开源模型服务于全球的科研院校、学生、开发者、创业者人群,推动百花齐放的应用滋长;API开放平台提供企业商用,协助企业实践AI 2.0的智能化转型。
提出TC-PMF方法论,拒绝ofo式烧钱打法
而在产品力之外,如何提升自身“竞争力”,李开复也为零一万物设计了一套全新的“方法论”。
李开复认为,PMF(Product-Market Fit,产品市场契合)这一概念已经不能完整定义以大模型为基础的AI-First创业,应当引入Technology(技术)与Cost(成本)组成四维概念——TC-PMF。“做TC-PMF,技术成本X产品市场契合度,尤其推理成本下降是个‘移动目标’,这比传统PMF难上一百倍。”
随着高性能计算硬件的迭代和模型优化技术的普及,大模型推理成本的大幅度下降已经成为可预见的趋势所在。李开复表示,在普惠点终将到来的前提下,能够率先察觉、并达到TC-PMF这一普惠点的玩家无疑会占尽先机。
而要做到这一点,模型、AI Infra、应用这“三位一体”的优异能力缺一不可。基于此,零一万物将“模基共建”、“模应一体”列为公司的顶层核心战略。
* 模基共建
AI Infra(AI Infrastructure人工智能基础架构技术),主要涵盖大模型训练和部署提供各种底层技术设施。在李开复看来,自研AI Infra是零一万物必然要走过的路,零一万物也自成立起便将AI Infra设立为重要方向。
零一万物模型训练负责人黄文灏表示,“第一年大模型行业在卷算法,第二年大家在卷算法+Infra。在国外一线大厂,最高效训练模型的方式是算法与Infra共建,不仅仅关注模型架构,而是从优化底层训练方法出发。”零一万物即是如此,模型团队和AI Infra团队高度共建,人数比为1比1。
据介绍,着力于实现计算效率的优化,经过多方面优化后,零一万物千亿参数模型的训练成本同比降幅达一倍之多。
* 模应一体
无论是2C还是2B,“模应一体”的思路始终贯穿零一万物的商业实践——模型团队与产品团队紧密结合,摸清模型能力边界,针对某一应用场景去优化专有模型。
零一万物生产力产品负责人曹大鹏表示,“AI-First不等于AI Only。模型、工程、算法、产品要基于场景深度结合,模型长板匹配刚需高价值场景,构建AI-First工作流,追求极致体验、一站式解决用户问题,而不是单纯秀模型能力肌肉,拿锤子找钉子。”
“万知”,正是这一理念的最好证明。它从“找、读、写”职场人的三大需求精准切入办公场景刚需,AI助力之下的文件撰写提效超10倍,低专业判断的日常白领任务节约时间超8成,联网生成回答、PPT速率远超行业平均水平。
来源:零一万物
API与万知等C端应用共同构建起了零一万物的商业落地版图,也成为零一万物追逐TC-PMF的重要实践。在李开复的规划中,零一万物将一步步实现落地,并最终达到TC-PMF,打造出AI 2.0时代的超级应用,实现让通用人工智能普惠各地,人人受益。
李开复认为,TC-PMF所带来的AI普惠点终将来临,这一次市场竞争将不再支持共享单车式的烧钱大战,采用以资金“跑马圈地”商业模式的企业必然会率先力竭,冷静判断行业发展进程,脚踏实地打磨TC-PMF才是更符合长期主义的路线。“ofo式的补贴逻辑不再适用于AI 2.0,希望大模型赛道的竞争聚焦于达成TC-PMF。”
单品接近盈利、剑指过亿营收,即将开启新融资
在李开复“新打法”的带领下,零一万物也早已将“盈利”提上了日程。
据介绍,无论是B端API还是C端应用,零一万物都已开启海外的落地尝试。
去年9月开始,零一万物便聚焦生产力、社交赛道于海外应用展开探索,已有4款产品陆续上线。
目前,零一万物海外生产力应用总用户接近千万,营收今年预期过亿元,已实践出大模型2C产品的TC-PMF——产品ROI为1,初步摆脱烧钱获客,成功验证了AI-First产品的用户订阅制商业模式。
由于海外市场与国内市场在付费意愿、市场环境方面存在差异,目前万知采取限时免费模式。据曹大鹏介绍,后续万知会结合产品发展和用户反馈推出收费模式。
而在“自身造血”之外,作为创新工场塔尖孵化的第七家公司,零一万物可谓“含着金汤匙出生”。
后续,凭借李开复的个人魅力,以及零一万物在大模型赛道的“狂奔”姿态,公司在2023年11月获得了阿里云领投的新一轮融资,投后估值超10亿美元。
至此,成立不到半年,零一万物便正式跻身大模型独角兽行列。
来源:天眼查
对于最新融资进展,据凤凰网科技消息,李开复透露称,零一万物将在几周内完成2.5亿美元Pre-A轮融资的第二部分融资,并将在年底前开始为其A轮融资寻找投资者。
值得一提的是,在被问及“某创业公司创始人被传套现”这一热点话题时,李开复表示,对他个人而言,实现通用人工智能是他40年来的梦想,从自己攻读博士的申请信里就曾写到,有实现这个梦想的机会才是推动他努力的主要动力。
李开复表示,自己一年前就已向投资人做出过承诺,十年不套现。