文|适道
编辑|狮刀
热钱从大模型涌向了AI应用,有多少诞生,同时就有多少倒下。
去年9月,a16z列出了一份AI应用Top50榜单,如今榜单上的20多款已经掉队。
国内情况好像更差。一个直观的判断:你能喊出几个AI应用(不排除在B端)?
QuestMobile数据显示,头部AIGC App运营数据活跃率低,均在20%以下;忠诚度方面,3日留存均在50%以下;流失风险高,部分App的卸载率在50%以上。
一方面是基础大模型性能不够;另一方面是没能和场景完美融合。前者很难靠自己解决;对于后者,不少创业者将希望寄托在专有数据上,认为即便没找到商业模式,但根据用户行为数据积累,可以实现飞轮效应。这个观点得到了“OpenAI第一投资人”Vinod Khosla的认可:大家近几年不大亏就行,重点是让模型得到尽可能广泛的使用,目的是获取大量数据,迭代优化。
但a16z的两位联合创始人却给“数据护城河”泼了盆冷水。他们认为,虽然每家公司都能够通过利用自身数据增强竞争力,但大多数专有数据不具备显著优势。
对于AI应用,什么才最重要?适道将结合a16z对谈Build Your Startup With AI,以及Business Insider对9家顶尖VC投资人的采访,梳理出可参考的观点。
1.体验大于技术,第一批“尸体”
VC积极寻找真正产生影响的个性化解决方案,而不是通用工具。
上一篇文章,我们探讨了a16z看好ElevenLabs的原因:ChatGPT确实可以做到一部分,但未来将有更多定制化和垂直的产品出现。
由此引出一个问题:如果ChatGPT比现在强大100倍,谁能在“大逃杀”中笑到最后?
先上反例。
Marc Andreessen表示:你可能懂得如何利用Chatbot,构建SaaS应用,用LLM写营销文案,于是你构建了整个系统。6个月后,ChatGPT碾碎了你(疑似内涵Jasper)。
Foundation Capital的Moore表示,创始人要先关注能解决的问题,然后再选择相应的技术。而且,不是每个产品都需要Chatbot。她早已疲于应付拿着通用用例找投资的创企。
直到半年前,Moore还会收到大批创始人的推介“我们将成为企业版OpenAI”。而她的回复是:我非常坚信OpenAI自己会成为企业版OpenAI。
根据Ben Horowitz的观点:你必须真正地独特。如果初创公司能抓住差异化,扎根特定领域,把握所有细微差别等等,即便ChatGPT如何进化,对你也没有太大影响。但如果你只是盘算着,自家大模型两年后可以达到ChatGPT-4的水平,那就得考虑要不要继续。
优化流程,提升体验
对于想做AI应用的创企,如何避免上述情况发生?
根本上,Ben Horowitz觉得这个问题有点棘手。因为涉及“正确性”问题。
举个例子,为什么AI现在只能当Copilot,而不是主驾?因为人类不能完全相信AI。
一个真正有用的AI应用要能当主驾。问题能解决吗?反正现在很难,而且你不清楚要从模型层面解决,还是应用层面。
不过,Ben Horowitz提出了一个模型不擅长的领域——流程。
当你用AI做视频,包含文案生成、声音制作、画面生成等一系列步骤,涉及多种工具。单一的模型不能理解你的终极诉求,但优秀的应用可以。它会将所有工具整合进一个流程,极大地提高制作效率。很多时候,应用是为了实现某种流程,而不仅仅是技术本身。
比如适道测评过SunoV3,虽然它可以自己写段solo,但只能“一锅出”,不支持调整分轨。这意味着,如果你要用SunoV3做一首成熟歌曲,必须辗转于不同的制作堆栈——生成采样、旋律、人声,然后一个个拼起来。这对于专业音乐创作者,反而会浪费时间。
Flybridge的Hazard也有相似观点——真正聪明的创始人会思考:要么利用基础构件彻底改变用户体验;要么用非常具体的方式完成工作。
一些投资人表示,他们不再喜欢“点”解决方案——例如在线支付处理或项目管理——而更倾向于全栈解决方案。
Bain Capital Ventures合伙人Rak Garg看重非常垂直的用例。他青睐在特定行业的小领域中引发变革的“超垂直”AI初创企业,并举了两个“样板”应用:
EvenUp,主要聚焦在个人伤害索赔领域。律师只需要上传原告信息,EvenUp就会自动生成一份完整报告,详细记录损失明细、伤害明细等等。
Norm.ai,主要解决大型银行的合规问题,识别并消除合规风险,缩短合规时间,实现自动和无限的任务委派。AI高级代理随时回答问题,并在法律和监管要求的基础上采取行动。
注意!拥挤的赛道始终不被看好。Obvious Ventures合伙人Shah补充:在一些赛道,技术早已商品化。例如笔记和生产力工具、营销和文案写作。你必须真正地脱颖而出,才能成为第N+1家公司。
技术不会帮你赚钱
如何判断应用的价值?要问客户愿意付多少钱。
Ben Horowitz认为,这才是真正的试金石,用来衡量你所创造的价值深度和重要性。
进一步,定价策略如何选?第一种,在成本价上进行合理加价;第二种,用价值定价。即判断产品对客户业务的实际价值。如果业务价值是100万美元,我能否收取10%,即10万美元?为什么是10万美元而不是5000美元?因为对客户来说值100万美元,而他们愿意支付10%。
在a16z的投资组合中,有一家专注于追债等服务的初创公司。客户不可能直接通过ChatGPT追债,但可以通过购买追债服务讨回金钱。这就是在价值与成本之间架起桥梁。意味着,即便一些产品在技术上大同小异,但因为提供了针对商业问题的具体解决方案,对客户价值巨大,也会赚到盆满钵满。
Ben Horowitz补充了另一个观点:在未来,开源模型和闭源模型的性能差距将会拉平。模型间会进行一番激烈的竞争,成本最低者胜出。那么,真正的价值在于工具层,谁能带给人们丝滑体验,谁就能胜出。
2.数据能当护城河吗?
数据是否决定成败?大致分成两派。
正方:简直是“命门”,代表Vinod Khosla等。
Vinod Khosla认为,创企近几年的目标不是赚钱,而是让模型得到尽可能广泛的使用,目的是获取大量数据,然后不断进化。
构建独特的应用需要独特的优质数据。清源创投(Foothill Ventures)创始合伙人王金林分享:从实际来看,能投什么样的企业,取决于(是否有)比较独特的应用。它要拥有独特的优质数据,依赖于其他公司研发的大模型但能够在独特数据基础上做好企业服务,这是有投资价值的企业。
另一位硅谷投资人,Fusion Fund创始合伙人张璐分享:拥有海量的高质量数据是企业在AI时代中立足的核心优势,且数据的质量比数量更重要。我看好医疗是因为医疗数据大多不在传统科技公司手中。因为担心数据被用于商业目的,这些企业不会将数据分享微软、Google等公司,它们更倾向于采纳新技术来内部实现AI赋能,并倾向于与初创公司合作。
风投机构Greylock有些“骑墙派”:可复制的专有数据集能够制造差异点,而且只有客户使用产品时所产生的数据才能形成长期壁垒。例如,客户标记自己的行为数据或与产品交互产生的数据集。此外,对于许多垂直行业而言,数据留在杂乱的传统系统中。因此,AI创企的战场从“旧壁垒”——数据来源,转移到了“新壁垒”——处理数据(包括合成数据)。
反方:重要但不绝对,代表NFX、a16z等。
NFX有个著名的“虚无主义”言论——AI应用就是瓶装水。该机构对几百家AI应用层创企研究发现:目前在数据和模型上,不太可能实现差异化:非结构化数据可能会在一段时间内给企业带来优势,但最终数据本身是不够的,模型大部分情况下也可以互换。
从哪里找应用差异性?一是用户体验。在加密货币中,用户体验就像吃玻璃。AI现在的问题也是如此,会有人想出一种惊艳的AI应用吗?但100%不是纯chatbot。二是分发。涉及和社交平台硬刚的问题。三是客户感知价值。这可能就变成了品牌营销,如何在最丰富、最平淡的材料注入情感价值。
a16z没有如此“极端”,但两位大佬均否定了“专有数据是最重要的壁垒”的说法。
Marc Andreessen讲述了一个场景——
一家连锁医院说:“我有大量专有数据,可以用这些数据来构建AI解决方案,够独特吧。”
Andreessen认为:在几乎所有情况下,这种说法都不成立。上述“优势”只是一种假象。因为网上以及各种环境中的可用数据量大到惊人。因此,尽管你拿不到个人具体医疗信息,但完全能够获取其他海量医疗信息,这些数据比所谓“专有数据”更有价值。就算“专有数据”有时管用,但大多数情况下不会成为一个关键壁垒。
他补充了一个论据,至今我们没有看到一个丰富或成熟的数据市场。如果数据真的具有巨大价值,它就会有明确的市场价格。这在某种程度上证明了数据的价值并不像人们想象的那么高。
Ben Horowitz表示赞同。他认为原始数据——那些未经任何处理的数据集——价值被过分夸大。比如很多大家认为最有价值的数据,比如企业自己的代码库,很多都存放在GitHub上。而a16z合作过的所有企业,没有一家是基于自己的代码建立独立的编程模型。
他指出,每家公司都能够通过利用自身数据增强竞争力,例如Meta借此训练大模型。但是,大多数专有数据不具备显著优势(只有非常特定类型的数据具有真正价值)。因此,如果觉得收集数据能像卖石油一样变现,或者认为其是新的石油资源,很不切实际。
总结,正方认为专有数据因稀缺而珍贵;反方认为专有数据只在少数情况下稀缺。
有趣的是,a16z确实刚刚给一家AI搜索引擎Hebbia领投1亿美金。Hebbia瞄准了大量不公开数据,号称可以读取并理解没有被接触到的非结构化私人数据。其官方博客更是挑衅Google——只索引了全球4%数据,而自己要处理剩下的96%。如果真的如此,那么所谓专有数据,实际是在“裸奔”。
顺着这条思路,可以提出两个问题:
1、真正“稀缺”的数据到底是什么?Ben Horowitz又讲述了一个场景:对于保险公司来说,你能获取一般数据库中人们的寿命信息,但不知道他们的具体健康状况和生活习惯。此时,真正有价值的数据是,具有特定档案和实验室结果的人群,他们的预期寿命是多久。
2、数据越多、越好,顶层的应用就会变得越好吗?如果是,数据的质量和“海量”谁更重要?如果不是,那么体验和数据孰轻孰重?适道认为,短期内数据会带来飞轮效应,且体验优化取决于数据,但长期来看,如果AI应用出现“通胀”,数据的护城河作用也要打个问号。
期待在评论区看到各位的精彩观点。