马蜂窝被捅背后,数据正义和生意在哪?

真实、有效的数据中,永远有新的生意。

正确的数据代表一种正义,比如前几天一个创业团队乎睿数据“捅”了马蜂窝,用正确的数据说出了一丝真相。

但很多人忽视的是,正确的数据原本是一桩大生意,而中国市场的事实是,大多数数据服务公司以提供虚假数据、贩卖排名为商业模式,在没有找到健康的商业模式的同时,却在驱赶真实数据。

乎睿数据这种新兴团队有可能成为数据市场一股清流,把正确数据商业模式带回中国市场。

1 、数据正义

正义有时候看起来并不重要,乎睿数据和公众号作者梓泉很快就会被公众遗忘。

事件无需再赘述,乎睿数据是一个做语义分析的团队,即通过人工智能技术对自然语言做分析,通过工具扒拉出马蜂窝内容数据造假的事实,而马蜂窝造假的目的是将用户引向特定的商家。

在乎睿摆出的数据面前,很多人都会相信马蜂窝造假的事实,但马蜂窝并不会因此受到多大影响,他们知道,只要迅速让公号闭嘴,事情很快就能过去,毕竟信息洪流之下,人们的注意力两天就会转移。

马蜂窝起诉了乎睿数据和公众号梓泉,按照惯例,接下来就是申请“行为保全”,禁止该公众号继续发布相关内容,甚至是向媒体发律师函,要求删除相关文章。

在起诉之后,马蜂窝的律师函应该已经马不停蹄地递送到新浪、微信、知乎等各大社交平台以及凤凰网、新京报等媒体平台,要求删除相关文章。一般来说,这些平台在收到相关权利人的律师函后,都会予以删除,因为平台并没有能力判定是否构成侵权,所以采用保守做法,无可厚非的。

马蜂窝被捅背后,数据正义和生意在哪?

马蜂窝向法院提起诉讼

公众号“逻格斯说法”指出,代他人发类似的律师函,已经成了一个产业链,“一些中西部的小所会承接这类案件,不对事实做基本的调查,批量向全平台发送律师函,一封律师函只收取一两百块钱,删除负面新闻的效果非常好。”

也就是说,不管最后诉讼是否会胜利,公号和媒体在不再讨论相关内容之后,这件事情会从公众议题中逐渐消失。

马蜂窝这些网站上的评论在很大程度上影响着个人的购买等生活决策,马蜂窝这些网站用如此大的成本去造假也侧面反应了这个问题。

梓泉在他的文章里写到,“9月份,乎睿数据团队,带着这份起底报告,找了国内几家知名的科技媒体,他们听说了事情很积极,但是,一听说主人公是马蜂窝,都沉默了。”

在这种情况下,梓泉刊发了这几篇文章,而从媒体报道影响力来说,梓泉这几篇文章的影响力堪比那条被转发的锦鲤,的确不小了。

但即便如此,随着被禁言,公众淡忘,以及没有任何司法部门介入打击这种行为,事情很快就过去了。

而在大数据时代,这种造假无处不在,正确的数据偶尔能够指出一些真相,但往往又被卷入信息洪流之中。

2、 好数据好生意

如果说在公众的注意力中难以追求持久的正义,可持续的商业模式在某种程度上能够让这种正义的影响力更为广泛。

乎睿数据其实是有良好的商业模式的,比如通过语义分析,它可以提供咨询服务。

在马蜂窝的案例中,它可以是投资人尽调的工具——2015年2月,马蜂窝获得高瓴资本、启明创投的C轮融资,金融逾亿元;梓泉的公号文章中指出,在那之后,马蜂窝点评异常活跃,到了2017年12月,再次获得淡马锡等一共1.33亿美元的D轮融资。如果投资人对于马蜂窝的内容造假有一定的识别能力的话,对他的活跃用户等指标有不同的判断,也许会重新做投资决策。

乎睿数据的成员,拥有大数据分析、自然语言处理这些技术和教育背景,整体解决方案也是以自然语言分析为入口,提供舆情预警、内容采集以及文本溯源等等,这些都是能够为公司策略、投资机构种种商业决策提供服务的。

从海量数据中抓取数据,并形成商业智能分析并不是新生意,但乎睿特点在于对自然语言的分析。如果说传统的数据公司支持的是对数据的分析——在行业中称为有结构的数据,而自然语言分析则是非结构数据,在深度学习等AI技术成熟之前,难以实现这样的分析,甚至得出结论。从2012年开始,深度学习等基础技术逐渐成熟,而语义分析并提供商业智能决策毫无疑问是深度学习技术商业化的方向之一。

乎睿这种对于自然语言的分析在美国已经有同类型的公司。

在亚马逊上也存在刷单行为,Fakespot.com也是一个通过自然语言分析来提供评论分析服务的平台。用户可以将评论复制放入搜索框,从而得出评论是否是伪造的结论。除此之外,这家公司还提供品牌的排行榜,即通过大数据分析,得知哪个商家在给产品评论造假,而哪家没有。

这家公司在2016年7月成立,在2018年9月才宣布了种子轮融资,而根据公司自己提供的数据,年收入已经达到150万美元。

数据服务永远是一门好生意。如果说提供语义分析的数据服务还是新兴生意的话,那些传统提供结构数据,比如金融数据、创投数据的公司已经展示了可观的商业前景。

CB Insights是一家提供科技行业市场数据的公司,他们的数据报道和榜单被大量引用,并已经成功实现盈利。

“我们每个月都会保证利润大于成本。”创始人Sanwal在2017年接受采访时表示,每年利润固定增长大概100%。

马蜂窝被捅背后,数据正义和生意在哪?

CB Insights创始人Sanwal

据了解,其收取的企业服务收费用范围为每年2万~6万美元,定制化的企业服务收费则达到10万美元以上。

“我们采用方法之一是数据抓取,所以也会使用大量的非结构化数据。它们的来源十分广泛,可以是新闻媒体报道、科技行业报告、公司财报等等”,Sanwal在接受媒体采访时说,他们利用这些数据来帮助用户分析未来某个科技产业的发展方向、竞争对手的发展方向,以及他们最应该关注的问题是什么。

根据介绍,CB Insights数据来源分为两个部分,60%是通过爬虫技术从网上获得的,每天要对上百万个网站抓取数据,此外,还专门开发了软件工具,从中国、日本、韩国或者新加坡等亚洲国家的在线出版物中寻找数据。比如在中国,腾讯科技是CB Insights引用源之一。

CB Insights剩下的40%的数据是直接获得的,即由机构主动向他们提交,这些数据他们通过新闻简报或行业调查的方式收集。

目前CB的客户主要是企业、VC及数据机构的用户,或者交易员、分析师、投资银行等。

当然,数据生意最成功的莫过于彭博,这家公司提供金融数据服务在市场上的地位始终无人能够撼动,全球有32万人每年支付约2.4万美元,其中以交易员、分析师和经纪人为主,从彭博终端获得即时的市场数据、新闻或者是其它同行交流。

作为非上市公司,福布斯提供的数据显示,2017年,彭博的收入为96亿美元。因为是私有公司,利润无从得知。但是按常规估计,即使20%的利润率及30xPE,彭博的估值也在500亿~1000亿美元之间,这个估值已经超过华尔街的标志企业高盛。

3、 坏数据坏生意

好的数据始终都是一门好生意,美国市场证明了这一点,坏数据是坏生意,中国市场也证明了这一点。

艾瑞咨询就是一个例子。作为一个数据服务公司,9月19日,却传出多名高管被有关部门带走协助调查的新闻,被带走的原因暂且不谈,这家公司原本准备在新三板上市,也证明了盈利情况并不乐观——坏生意。

这和他们提供的坏数据有关系。艾瑞一直被指打着调研的旗号收取“保护费”,进而编造数据、调整排行,作为一个数据服务公司,提供的却并不是真实的数据。

艾瑞提供的主要是科技行业的数据,而且大多是非上市公司,大多没有权威第三方的审核,也就是说,在造假上有较大的空间。

2014年4月,《扬子晚报》曾报道,女性APP美柚与艾瑞咨询以及水军公司联合造假,打压竞争对手大姨妈APP,后因美柚在现金结算上的疏忽,导致水军公司的内部人员爆出此事。

2016年2月,张一鸣发朋友圈怒怼艾瑞敲诈勒索,表示禁止公司任何部门和艾瑞合作,并以未曾给过艾瑞一分钱为荣。

马蜂窝被捅背后,数据正义和生意在哪?

张一鸣朋友圈怒怼艾瑞

但毫无疑问,仍然有许多公司愿意用这样一家有知名度的市场调研机构的数据来为自己背书,在招股书中引用艾瑞数据,显示市场占比41%的优信在美股遭遇滑铁卢,小米在招股书中引用了100多次艾瑞数据,股价在港股近乎腰斩。

公开数据显示,艾瑞2015年营收为1.9亿元、2016年营收1.7亿元、2017年前9个月营收1.33亿元,但在新三板冲击上市,也就是说这家公司至少没有达到创业板“最近两年净利润累计不少于一千万元”等盈利要求。

在中国数据服务公司普遍造假的情况下,CB Insights这种美国公司在进入这一市场时就有些水土不服,“要获取中国的信息我们需要不断改进我们的技术”,创始人Sanwal接受采访时说,在这个市场如何建立可信的数据基础,他们面临了挑战。

在他们调研了30个左右的中国无人机公司后,有一些公司,甚至是投资者联系他们,想要让他们把公司列在行业分析中。

Sanwal在采访中克制又礼貌地说,“我们并不接受这样的方式,我们只需要可靠的数据,然后我们根据数据分析得出这些公司的相对真实的情况,只有这样才是可靠的。”

4、 新数据生意

彭博在金融市场地位如此不可动摇,但CB Insights仍然从一级市场和行业分析这几个板块找到了切入点,而在行业分析逐渐成熟的情况下,有乎睿这样的创业团队从语义分析角度找到了新的切入点。

分析工具从公式到爬虫再到现在的语义分析工具,买方从华尔街到硅谷的创投。真实、有效的数据中,永远有新的生意。

彭博创始人Michael Bloomberg毕业后去华尔街投行所罗门兄弟做销售,这并不是华尔街的一等职位,但他一干就是15年,在1972年熬成了合伙人。在所罗门的时候,他还负责过这家公司的IT部门。所罗门兄弟被收购时,他获得了人生第一桶金,创办了彭博,他选择了一条巧妙的道路,计算机和金融的结合。

在没有彭博的工具之前,债券交易员们是用铅笔和纸计算债券的收益率等重要参数,而计算过程十分复杂。彭博工具的出现改变了这一切,一个快捷键+债券代码,就能展示出该债券的收益率及大部分信息。

在彭博的阴影之下,CB Insights找到了一个缝隙——从公共信息中收集一级市场的财务信息和融资状况,据创始人Anand Sanwal介绍,CB Insights的目标是成为“私人企业的彭博社”。

正式建立CB Insights是在2011年,最初定位为风险投资数据库。但风险投资行业的市场规模是远远小于二级市场的,且真实性无从验证。这也决定了风险投资数据库的天花板很快就能触摸到。愿意付费的B端客户不多,而且对于4-5人小规模的风险投资基金来说,SaaS并不是必须的。

于是,CB Insights再一次开拓商业模式,借助自有的数据优势,用旗下的SaaS分析工具,写出独特且深厚的研究报告,并且被广大投资机构、新闻媒体付费订阅。

随着影响力的加深,CB Insights的每月订阅费用也从2016年的1599美元到12499美元不等大幅上涨到如今的4134美元到20416美元不等,每年订阅费用收入高达500万美元。

而这些研究报告也迅速扩大了CB Insights在行业内的影响力,并为其带来了类似毕马威,Microsoft以及Salesforce这样的大型机构客户。并且CB Insights逐渐成为硅谷几乎所有VC进行决策都倚赖的数据智库、以及《纽约时报》和《华尔街日报》这样的顶级媒体报道的可靠数据来源。

彭博也试图做过产业分析,试图捕捉更广泛的研究人员和分析师的市场,但不算成功。比如在法律、政府和清洁能源以及税收等产品中,彭博投入巨大但收益甚微。

从彭博到CB Insights,以及今天的乎睿数据,他们提供的数据结果越来越被普通人需要——金融数据给华尔街,而行业数据可以针对更广泛的人群,乎睿数据甚至可以被普通消费者所使用,从这个角度,数据工具越来越普世,永远有新的生意等待被挖掘。

声明:本文内容仅代表该投稿文章作者观点,不代表蓝鲸号立场。 未经授权不得随意转载,蓝鲸号保留追究相应责任的权利