文|听筒Tech 饶言
编辑|才哥
当互联网大厂还醉心于在AI的“百模大战”中大显身手时,谁也没有料到,他们竟然被一个“新人”抄了后路。
Kimi的爆火,来得太过突然,也很意外。
Kimi有多火?火到宕机成了近期常见的事,以至于官方不得不出面道歉。
说到AIGC,必聊Kimi,成了网友们最近的日常。很多人发现,自己的朋友圈和微信群几乎都在推荐Kimi,“这几天微博热搜几乎每天都能刷到Kimi”、“如果还没用过Kimi,那你就OUT了”……
“此前我一直用文心一言,直到有一天,朋友推荐了Kimi,我才知道,什么是好用的国产大模型。”80后李琳是文字工作者,她对大模型的需求主要集中在资料的检索和整理,之前文心一言能够基本满足她的需求。
但Kimi给了李琳全新的体验,“仅从资料和素材的整理这一点来言,Kimi体验感明显胜于文心一言。”
王明是一位资深AI从业人员,他对此并不惊讶,他见证了Kimi从内测到爆火的过程,“很显然,‘草根出身’的Kimi更懂得什么是用户真正的需求。”
“Kimi仍有一些不足之处,但从目前的用户体验来看,它已经走在一些大厂大模型的前面。”王明直言,在目前在国产大模型中,他更看好Kimi的未来。
资本市场也对Kimi表现出了满腔热情。自3月中旬以来,A股市场便催生了Kimi概念股,不少公司的股价受此影响,接连大涨。
万兴科技是接入Kimi的AIGC软件企业之一,旗下视频创意软件万兴喵影接入Kimi。在万兴科技AI创新中心总经理齐镗泉看来,Kimi的出圈不仅反映了公众对于新兴技术的兴趣和期待,也体现了资本市场对于AI技术的信心和追捧,“这也是个积极的信号,展示了AI应用的潜力和商业价值。”
“Kimi的出圈并非一蹴而就,其背后是大量的研发投入和持续的技术创新。”齐镗泉对《听筒Tech》表示。
不过,Kimi未来能延续目前的火热吗?目前显然还无法判定。实际上,随着Kimi的爆火,有关其技术处理能力和商业化路径的质疑声也不断。
齐镗泉也提示了风险,“随着AI技术的广泛应用,我们也应该关注其可能带来的数据安全和隐私保护等问题,并积极寻求解决方案。”
01 Kimi到底表现如何?
“用过一次Kimi后,现在大部分时候都选择使用它。”不少人和李琳的做法一样,长期需要阅读大量数据和报告的证券分析师张强最近也在使用Kimi,在他看来,Kimi界面更友好,在文生文的大模型中,更贴近自己的需求。
张强已经获得Kimi的200万字长文输入内测资格,他经常将一些上市公司的年报或者IPO文件全文输入到Kimi,他对《听筒Tech》表示,Kimi能够迅速将核心内容提取出来,包括上市公司的基本信息、财务概览、公司治理等核心内容,“相对而言,其他国产大模型在归纳总结方面有所欠缺。”
Kimi的用户体验到底如何?《听筒Tech》对Kimi、文心一言、通义千问、豆包,以及腾讯混元助手做了一系列小测试。
首先测试的是这些大模型对资料的总结能力。
需要说明的是,在几家大模型的PC端版本中,Kimi、通义千问、豆包、文心一言对文件上传功能操作友好,而腾讯混元助手PC端对文档的上传界面不太友好,《听筒Tech》几经折腾,都未能找到将文件上传到对话中的办法。
《听筒Tech》随意抽取了一份最新的《美团2023年财务报告》进行测试,测试结果如下。
从左至右分别为:Kimi(上)、豆包(下)通义千问(上)、文心一言(下),来源:《听筒Tech》截图
从测试结果来看,正如张强所言,Kimi对文档的归纳总结功能明显优于其他几家大模型。对这份财务报告,Kimi的总结清晰且简明扼要,豆包和通义千问虽然也能总结,但结果呈现并不理想,而文心一言则需要进一步的指令。
随后测试的是用户常用的资料检索和整理功能,《听筒Tech》对各大模型进行了“阅读GTC大会黄仁勋的演讲”的测试,结果如下。
从左至右分别为:Kimi(上)、豆包(下),通义千问(上)、文心一言(中)、腾讯混元助手(下)来源:《听筒Tech》截图
从大模型的检索结果来看,Kimi准确且精简地对黄仁勋在2024年GTC大会上的演讲内容进行了总结。
除Kimi外,其他几家大模型均无法检索到黄仁勋在GTC大会上的演讲内容,腾讯混元助手甚至无法生成任何答案,需要进一步的指令。
创作能力是每个大模型都要具备的重要能力之一,这能够更好地理解和模拟人类的思维过程,从而生成更具创意和价值的内容。
视频脚本的生成,便是用户常用的文学创作能力大模型功能之一。为此,《听筒Tech》测试了大模型的视频脚本制作能力。
本次测试的内容是“以‘运动改变生活’为主题生成视频脚本”。从生成的结果来看,Kimi、文心一言、通义千问、豆包均能生成符合基本要求的视频脚本文案。
从左至右依次为:Kimi(上)、文心一言(下)豆包(上)、腾讯混元助手(中)、通义千问(下)来源:《听筒Tech》截图
其中豆包生成的视频脚本包含了时长、地点等元素,相对比较专业。Kimi与文心一言生成的脚本内容更为连贯且有条理。而腾讯混元助手甚至将上一个问题混淆到了脚本中。
从测试结果来看,Kimi、文心一言、通义千问和豆包都具有较强的视频脚本生成能力,可以为视频制作提供很好的帮助。相比之下,腾讯混元助手对问题的理解显然不够。
从以上简单的综合测试结果来看,实际上,在文生文的基础功能上,Kimi的处理结果更贴近基础用户的需求。
对于像李琳以及张强这样的基础用户而言,Kimi目前的文生文基本功能已经远超其他国产大模型。
当然,他们也期待Kimi能够解决更多问题,李琳笑言,“我已经期待它帮我做PPT了。”
02 为什么出圈的是Kimi?
Kimi到底是谁?
公开报道显示,Kimi的母公司为北京月之暗面科技有限公司(以下简称“月之暗面”),创始人为杨植麟。
企查查数据显示,月之暗面成立于2023年3月,同年10月推出全球首个支持输入20万汉字的智能助手产品Kimi。
创立至今短短一年时间里,月之暗面已经获得红杉中国、真格基金,以及阿里巴巴、小红书、美团等知名机构和企业在内的两轮融资,融资金额超12亿美元,投后估值已约25亿美元。
今年年初,Kimi的访问量开始上涨。据Similarweb和七麦数据的资料显示,2024年2月18日至3月16日,Kimi的日均浏览量将近20万次,Kimi在全平台的累计下载量为50万次。
尤其是最近两周,Kimi的访问量更是爆增。根据Similarweb数据显示,近两周Kimi的访问量分别为152.0万和225.0万,一度引发平台访问异常的情况。
在众多国产大模型中,为什么出圈的是Kimi?
在王明看来,一方面,与其创始人团队的背景不无关系。“从公开的资料来看,月之暗面可以称得上汇集了目前国内大模型领域相对领先的人才的一个团队。”
公开资料显示,杨植麟出生于1992年,被誉为最年轻的中国大模型创始人。其本科毕业于清华大学计算机系,师从清华教授、知名AI学者唐杰。博士毕业于卡内基梅隆大学计算机学院,师从苹果AI研究负责人Rualan Salakhutdinov 和谷歌首席科学家 William Cohen。
据公开报道,杨植麟目前仍是清华大学交叉信息研究院(以下简称“交叉信息院”)的助理教授。要知道,交叉信息院涵盖大名鼎鼎的清华“姚班”。杨植麟与图灵奖得主杨乐昆(Yann LeCun)和约书亚·本吉奥(Yoshua Bengio)均有过科研合作。
图:杨植麟在清华大学交叉信息研究院的任职信息,来源:清华大学交叉信息研究院官网 《听筒Tech》截图
实际上,月之暗面是杨植麟第二次创业,在此之前,他曾与别人共同创立了循环智能,也拿到了红杉中国的投资,并在2021年和华为云联合推出了当时全球最大的中文语言模型“盘古”。
另据媒体报道,月之暗面的核心团队成员在大模型方向有重要发明,如RoPE相对位置编码和group normalization,这些技术是Meta LLaMa、谷歌PALM等主流模型的重要组成部分。其另外两位创始人周昕宇和吴育昕,同样是AIGC领域的领先技术人才,有过1万+的Google Scholar的引用。
一位在学术上与杨植麟有交集的AI领域研究学者Liam认为,月之暗面的团队可以称得上目前国内领先的AGI团队之一,他亦认同业界对杨植麟“坚定的AGI信徒和有技术号召力的创始人”的评价。
Liam对Kimi的出圈并不意外,“实际上,AI技术圈内的人从去年几家公司宣布做AGI的时候,就基本确定月之暗面和智谱是最有希望做成的,也正因此,头部资本会在第一时间挤向这几家公司。”
在Liam看来,杨植麟是一位“为数不多的善于从第一性原理思考问题的学者”,“Kimi走的long-context的技术路径与大厂不一样,或许也是源于其对第一性原理的思考。”
另一方面,“杨植麟对什么是用户真正需要的大模型也有清醒的认知”。Liam向《听筒Tech》透露,在杨植麟看来,一个好的产品,应该知道用户想要什么,通过满足用户的需求来实现产品的优化,“这也是为什么月之暗面一开始推出的产品便是TO C,而不是TO B的原因所在。”
在Liam看来,“TO C的定位,能够给Kimi带来更多‘训练’的机会,更有利于产品的优化和完善。”
市场显然也认可杨植麟对Kimi的这一定位,国信证券的分析报告指出,Kimi日活用户的显著增长反映了Kimi在模型优化、人才扩展和用户吸引方面的成功策略。
“Kimi的成功不仅依赖于其技术优势,更在于其对用户体验的重视,包括通过数据驱动的持续产品优化、创新的分享机制以及对核心功能的精准打磨,这些因素共同提升了Kimi的市场竞争力。”
中信建投也在其研报中表示,“月之暗面打造高关注度应用Kimi Chat,一方面在于核心团队技术背景深,另一方面在于产品面向C端免费开放,注重产品运营。”
在齐镗泉看来,用户需要的,是一个能解决特定场景中80%问题的大模型、一个结合了本土用户使用习惯的本土化大模型、一个能够与用户进行交互和共创的大模型。
“大模型始终会是’应用为王‘。大模型需要提供的并不是一个浅尝辄止的工具,而是一套标准化的流程支持,包括基础大模型、完整的工具链、丰富的应用,以及有专家支持的服务。”
这些,或许就是Kimi率先出圈的原因。
Kimi火速出圈还有一个原因,那就是前期异常低调,之前几乎没人听过这家公司的名字,这与大厂在AI方面的高调形成鲜明的对比。
如果说财大气粗的大厂更要面子,那么“草根出身”的Kimi则更注重里子。
03 Kimi能火多久?
爆火的Kimi能否如愿在大模型这一新战场中脱颖而出?目前来看,尚无定论。
仅从Kimi引以为傲的长文本处理技术来看,Kimi或将面临巨大的压力。
一个不容忽视的事实是,Kimi大模型爆火后,大厂正在迅速跟进。
3月22日,阿里通义千问宣布免费开放1000万字长文档处理功能,成为全球文档处理容量第一的AI应用。随后,360宣布智脑正式内测500万字长文本处理功能,该功能入驻360AI浏览器。另据媒体报道,百度也将免费开放200-500万长文本功能。
在一位AI技术人员看来,“长文本处理这项技术并不难,只不过之前的大模型关注点不在这一方面。更重要的是,长文本处理相对而言,成本太高,甚至可以说是’亏本的生意‘。”
该AI技术人员认为,“当市场意识到这一技术能迅速打开市场,势必会加入这一战场,这无疑将对Kimi造成巨大的压力 。”
实际上,一个简单的测试便能看出,该AI技术人员的观点存在一定的道理。
因目前尚未获得200万字的内测资格,《听筒Tech》对Kimi与通义千问分别提交了一份近35万字的《茶百道聆讯后资料集》,发出相同的指令后,kimi反馈“超出字数限制,只阅读了前31%”,而通义千问顺利对全文进行了总结。
一定程度而言,开放了1000万字长文档处理功能的通义千问,虽然总结的内容不尽如意,得到的直观结果优于Kimi。
图:目前Kimi(左)与通义千问(右)对长文档的处理结果,来源:《听筒Tech》截图
不过,Liam对以上AI技术人员的看法持不同观点,Liam表示,“长文本处理这项技术并不难”这个说法存在误解,准确地说应该是“将文本变长确实不难”,但是“在变长的同时不丢掉有效信息,保证模型对文本仍然有很深入的理解”存在很大技术难度。
在Liam看来,“在文本变长甚至变到无限长的情况下,保证计算量和计算成本可控”这件事,需要大量的基础研究来支持,大厂的人才密度不足以支撑这样的研究。
另一方面,从多次宕机的情况来看,也意味着Kimi后台需求解决的问题仍不少。
上述AI技术人员表示,虽然月之暗面确实汇集了一些领先的技术人才,但还需加强,“我看媒体报道,目前Kimi团队不足百人,这对于一家处于上升期的大模型企业而言,远远不够。”
不过,在Liam看来,人才密度是顶尖科技公司最关键的因素,而不是人才数量。
“这从OpenAI便能得出答案,ChatGPT发布时,OpenAI也仅100余人,都是领域内最顶尖的科学家和工程师,当然GPT爆火后,OpenAI开始大力扩招,人才密度有所下降,也因此引发了一些问题。”
另外,Kimi要想持续发展,就必须正视商业化这一难题。
目前,月之暗面的具体商业化路径仍未对外公开。Kimi爆火时,有媒体报道称,月之暗面相关负责人提到,年内将有商业化初步方案。
有业内人士称,Kimi的商业化可能类似于OpenAI,更倾向于一种通用性的商业化,例如商业化的高端接入入口用以扩展客户的应用等。
但这一模式能否落地,能否足以支撑Kimi的长远发展,尚未可知。
在王明看来,如果目前Kimi的获客成本真像媒体报道的“每天投入可能超过20万元”,那显然不是一个小数目,目前的商业模式也不足以支撑其未来的快速发展。
更重要的是,Kimi爆火后,进一步推动了“百模大战”的升级,国内外AI公司对其已形成围猎之势。
且不说国外,仅国内,腾讯、阿里、百度、科大讯飞、商汤科技等巨头和AI公司都纷纷推出了大模型,同时,各行业也不断涌现垂类大模型。
公开数据显示,目前,国内公布的大模型数量已超过200个。“这些对Kimi而言,都是巨大的压力。”王明直言。
在此前接受媒体的采访时,杨植麟曾表示,“AI不是我在接下来一两年找到什么PMF(Product/Market Fit,产品/市场契合),而是接下来十到二十年如何改变世界。”
这或许不是杨植麟一个人的愿景,也是众多国产大模型从业者所希冀的未来。
(文中李琳、王明、张强、Liam均为化名。)
参考资料:
1、《Kimi掀起国产大模型长文本竞赛》,来源:《北京商报》;
2、《互联网大厂,集体「围剿」Kimi》,来源:《新浪科技》。