王慧文Copy OpenAI to China

摘要:在资本们看来,商业价值比技术理想崇高的多。

一条朋友圈,一个美团联合创始人身份,将ChatGPT的火热推到了一个全新高度。

前几天,王慧文拿出5000万美元向天下英雄招榜,随后真格、源码两大资本2.3亿美元“光速”入局,令整个科技圈咋舌。隔日,第一个“好汉”刘江宣布加入。有趣的是,刘江曾做过美团技术学院院长。颇有一声呼喊,好汉齐声上梁山的味道。

另一边,来自谷歌的前科学家李志飞也开始了隔空喊话,内容同样是有关中国版的OpenAI运动。一时间,ChatGPT好像成了一部通向未来的电梯,不管你是躺着还是站着,最低5000万美元,只要站上去了就能起飞。

技术的进步,确实会让世界更加美好。但王慧文明确说过自己不懂技术,众多大佬火急火燎地跟进,不管懂不懂都选择上车再说。又好像透露出这场行动背后,潜藏着技术之外的逻辑。

AI再造一个美团?

这几日,对于王慧文引领的AI创业潮,市场上有很多解释和质疑。

有人说王慧文讲了一个VC无法拒绝的故事。身份、背景、热度要什么有什么,简直就是个“完美”的投资标的。

有人质疑创投圈对AI的烧钱能力完全没数。海通证券科技行业首席分析师郑宏达称“5000万美元够干什么的?大模型训练一次就花500万美元,训练10次?互联网的人啥都不懂,就只会营销,一点都不踏实。”

但这些质疑都还处于王慧文的OpenAI是否能成功的层面,太过表面。如果将视野聚焦在王慧文本人身上,一条全新的草蛇灰线便将展露出来。

王慧文,或者资本们一拥而上要做的“OpenAI”,很可能存在着某种路径依赖。

首先,国内很多互联网大厂是依靠Copy to China起家,而不是首创。对标OpenAI给了投资者们一定的安全感。

将国外已经验证成功的商业创新引进国内,其实贯穿了许多公司的发家史,例如腾讯(ICQ)、淘宝(ebay)、滴滴(Uber)、美团(Groupon)等等。甚至于整个Web1.0和Web2.0 时期,几乎所有大型互联网公司身上都有这种对标的影子。此外,在生物医药行业中,相对应地也存在各种类型的仿制药(me too、me better)。

这种模式能很好地规避一些风险,甚至创业者募资的时候,可以直接说自己是做对标国外的XXX。对于投资者来说,尽可能降低风险是决策时的重中之重。如果有一个类似的模式已经大获成功,会让决策者觉得风险降低很多。

其次,王慧文本人似乎也在追求某种“不变的变革”。

王慧文本人的履历中,最为精彩的部分就是人人网和美团。前面说了,美团是对标了Groupon的团购。有趣的是人人网当年上市的时候,宣称自己是Facebook+Zynga+Groupon+Linkedin,连套了四个国外标的,堪称是终极“缝合怪”。

2020年,王慧文离开美团,期间投资了一个社交App即刻。根据其在即刻的发帖,可以看到这段时间,他曾研究过crypto(加密货币)。4月的发帖中,其提出了一个关于人类商业在获客和融资上的看法,认为“Web1,免费获客,风险投资扩张;Web2补贴获客,风险投资扩张;Web3,X2Earn/发Token获客,ICO扩张。

其中关于Web3的说辞,一般人可能很难读懂。

X2Earn的意思是用户可以通过在互联网上的行为获得收益。类似于拍摄生活视频放到视频网站上获得创作收益。发Token的意思是,发放具有兑换价值的虚拟货币。类似于《传奇》、《魔兽世界》这些游戏官方给玩家发金币,这些金币可以换钱。ICO扩张,意思就是发行新的虚拟货币融资。

这句话合起来的意思就是,让用户看到平台能提供收益/直接补贴,投资者认购平台代币融资。

相信看到这里,经历过Web1和Web2的老鸟,一下子就明白怎么回事了。这种所谓的变革,其实依旧还是广告收入+买客户+融资那一套。

很可惜,国内监管层早就看透了ICO盈利的本质是“铸币税”,禁止发行。如果说Web3有什么东西是过去没有的话,那大概是由于互联网底层硬件的发展,网速大大提高,所以今天才有了短视频、直播等一系列新型收入模式。

所谓的追求某种变革,本质上还是在科技进步基础上一次次重新复刻老套的商业规律。

最后也是最为关键的,OpenAI用ChatGPT向全世界证明了大模型AI是可行的,商业化也是可行的。

ChatGPT属于AI的自然语言处理(NLP)方向,至今为止共计演化了三代。在早期,很多研究者并不看好GPT模型,因为这个模型有些反直觉,并且非常烧钱。

按常理来说,人们认为在 NLP 领域使用语言一般包括三个步骤:接听到或读到的语言-理解意思-输出语言。但GPT模型直接绕过理解意思这第二层,可以实现尽量少的案例示范,对模型施加引导,就能直接根据输入的语言匹配应该输出的结果。

为了达到这样的效果,GPT相对其他模型,需要碾压式的参数数量(GPT3目前1750亿参数)。为了运作这样的超大模型,相对就需要无比庞大的算力。结果上来说确实令研究者非常惊喜,因为训练出来的效果,相对较小的模型来说,也是碾压式的优异。

但无论如何,今天ChatGPT的火热,证明了GPT模型的成功。ChatGPT仅仅两个月就成为了全球最快达到1亿用户的软件产品。速度如此恐怖,连抖音都望尘莫及。商业化上除了20美元正式版收费以外,背靠ChatGPT的相关产业以及各种各样的全新用途,在全世界的用户手中被各种开发,国内还产生了共享账号的营收手段。

王慧文和资本们看到的就是这个已经跑通了的全新C端SaaS的商业价值。

毕竟再造一个GPT不需要感受创新研究的艰辛,也不需要面对从0-1的不确定性。确定的路线+确定的成果,才是当前资本纷纷组团做中国OpenAI想要的最终结果。

困难和机遇

如果一定要对最终的结果做个预测,王慧文的中国OpenAI项目恐怕是很难成功。因为面临的难题很多,还都不是一时半会能解决的。

首先是技术实力。国内实验中做过的最大的模型是10亿个参数,GPT3的参数数量是国内的175倍。另外这几年百度、腾讯、阿里都投入不低于OpenAI的资金量(5-10亿美元)做大模型。但可能是效果不佳,普通消费者接触到的AI产品,也就是天猫精灵、小爱同学这类。侧面说明的可能还是技术实力上的差距。

其次,是硬件问题,训练AI需要庞大的算力。ChatGPT此次是用了5000块A100算力卡,但美国对国内禁运的首先就是A100。使用国产算力卡倒不是不行,只是芯片制程跟不上,导致英伟达1块卡,国内要用2-3块。相应数据传输时间也会变长,并且消耗的电力、物料成本更会成倍提高。国内很可能不会很快追上OpenAI 的算力投入。

但反过来看,资本的涌入又是一件好事。

GPT的热度会加速国产芯片的突破。由于此前国产芯片大多还是用于支持信创需求,缺少市场化的手段和竞争力。但可以预见的是,面临美国的封锁、GPT模型所需算力的影响下,国产芯片即将迎来新的订单需求。伴随着出货数量带来的规模效应,加上良性商业化变现的驱动,为早日突破技术封锁打下基础。

2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。

可以预见,伴随着政府的支持,未来将会有越来越多的资源涌入到大模型的赛道中。最终的获胜者或许只会是众多参与者中的几个,但其中的佼佼者必然将带动整个产业的升级进步。

写在最后

有时候,市场会对于一些充满技术名词的投资项目难以理解。毕竟理解科技需要厚实的知识基础,弄明白技术是如何实现的;但判断商业逻辑,很多时候只需要常识即可。

毕竟,任何商业模式最终还是要回归变现的价值;任何技术最终还是要回归为人类社会服务。

脱离理性,在哄炒和嘲讽的声音中,很容易丧失判断。两年前是元宇宙,两年后会不会是GPT?