李彦宏说透了国产大模型的现在与未来

摘要:冷思考与热驱动

文 | 无锈钵 山核桃

“中国的大模型很多,但是基于大模型所开发出的AI原生应用却非常少。”

11月15日,深圳2023西丽湖论坛上,百度创始人、董事长兼首席执行官李彦宏对国内AI市场给出的研判。

作为《时代》周刊所评选的全球AI领袖企业创始人,李彦宏留给人们的印象,一直是人工智能行业最坚定的支持者。

过往几个月里,身处AI赛道广阔前景之中“振奋感”,几乎贯穿了他的每一场公开演讲。即便是私下里为《智能革命》一书作序,他也毫不掩饰对于行业的期待:

“全世界都在为即将到来的人工智能革命感到兴奋。”

而在刚刚结束的西丽湖论坛上,面对国内大模型领域的“过热”现象,这个小小的传统被打破了,取而代之的则是一盆迎面的“冷水”。

正如他在演讲开头,抛出的那句直切主题的开场白一样:

“人工智能很热,但我想首先谈几个‘冷’思考。”

1、热过的大模型,何时“退烧”?

大模型赛道很火爆,这是过去的大半年里,各界人士都能直观感受到的现象。

然而,只有行业中感知最敏锐的那批人才能意识到,当下的大模型赛道,不仅广受关注,而且已经有了明显的“过热”迹象。

当下,人工智能行业“模型层—中间层—应用层”的宏观架构之中,大模型已经跃马当先,成为了占据绝对资源优势的主角。

“人工智能每收获1块钱投资,就有6毛钱流向了大模型。”

这个类比并不夸张,数据统计现实,2023上半年,国内人工智能领域共发生161起投融资事件,其中超过半数投融资直指算力设施和大模型业务,而涉及具体应用侧面的,不足四分之一。

从发布大模型的时间节点来看,国内的大模型训练起步,平均要晚于美国3年左右,然而据钛媒体《2023AI大模型应用中美比较研究》报告显示,单从数量来看,截至2023年7月底,国内市场已经累计问世了超过130个大模型,甚至超越了同期的美国市场。

大模型超量涌现的另一边,正如李彦宏所提到的那样:

“很多行业、企业,甚至很多城市还在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型。”

这种反常的“过热”背后,是越来越多从业公司、投资者和企业品牌的集体“迷失”。

对于从业公司来说,大模型之于AI行业,犹如操作系统之于互联网产业,是不折不扣的“基础设施”,无论是短期红利还是长期前景,都非常可观。

而对于投资人来说,入股算力中心、开发大模型也是“更保险”的商业行为,一方面,AI的中间层和应用层还没有跑出类似ChatGPT、文心一言这样的头部企业,缺乏现有案例参考,另一方面,相较于看不见的原生应用,买实体芯片、建算力中心更能直观的看见资金流向,从而帮助平衡投资风险。

最后,很多企业对此更是理解不深,顺着媒体和舆论的炒作,以为拥抱人工智能就是引入大模型,最终误入歧途,造成了对公司资源和社会资源的巨大浪费。

回望过去,各方复杂的博弈与思考,铸就了如今大模型的“过热”现象。

长期来看,这一现象所带来的危害已经逐步显露:

人工智能产业架构中,相较于模型层的落后,应用层本来可以成为国内市场弯道超车美国的机遇,然而当前过热的大模型赛道,虹吸了过多本该投放于应用层的资源,来“重复造轮子”,拖累了应用层的木桶板。

对此,李彦宏同样深有感触:

“人类进入AI时代的标志,是出现大量的AI原生应用,而不是出现大量的大模型。”

从这个角度来说,国产大模型,或许是时候该吃上一剂“退烧药”了。

2、AI原生带来的改变,才刚刚开始

类比互联网产业,操作系统所衍生的红利,固然成就了微软这一硅谷巨擘,但硬件层的英特尔、英伟达,软件层的亚马逊、谷歌、Meta、Netflix,以及产品终端的苹果、三星、华为等企业,同样向世界诠释着其他产业层级所蕴含的丰厚机遇。

同样的,人工智能产业要想收获长足发展,也必须要实现各个层级的均衡发展,多点开花。

当前阶段,意识到这一点的硅谷,已经开始了“各就各位”的新发展阶段,围绕相对成熟的大模型工具,开始朝细分方向衍化新应用。

参考美国的人工智能市场发展阶段,“AI原生应用”的崛起,需要两个前置条件:

·底层的基础设施——大模型已经具备了较为成熟的能力

·头部大模型已经实现了市占率领先,围绕大模型的内卷告一段落

对应OpenAI的高市占率,在国内大模型市场,以文心一言为代表的头部大模型,已经成为了开启“AI原生时代”的关键钥匙。 

从技术水平来看, 新发布的文心4.0在理解、生成、逻辑和记忆四大能力上,已经迎来显著提升;正如李彦宏所提到的那样,“4.0是迄今为止最强大的文心大模型”。 

具体而言,在生成能力上,文心一言除了生成文字内容,还包括了图片、视频、数字人等多模态内容,可实现的创作体裁超过200种,涵盖了几乎所有写作需求。在逻辑和记忆能力上,相比之前的版本也有了成倍提升。 

另一侧的市场占有率上, 文心大模型更是“遥遥领先”。 

截至10月中旬公布的数据,文心一言面向全社会开放以来,用户规模已经达到7000万,开发者5.4万,场景4300个,应用825个,插件超过500个。具体到调用量数据,也如李彦宏所说“可能比国内200多家加起来的调用量还大”,并且还在不断呈现指数级的增长趋势。 

从这个角度来说,伴随着文心一言等头部大模型的逐步成熟化,国内大模型市场千帆竞逐、野蛮生长的初级阶段,已经从事实上宣告结束。

基于这一背景条件,对于国内当前的人工智能市场来说,围绕文心一言等头部大模型,开启应用层的“AI原生时代”,已经是“正当其时”。 

这也是为什么,李彦宏在演讲的开头重点呼吁: 

“如果我们能够更加鼓励基于大模型的AI原生应用,就一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。”

3、繁荣AI应用生态下的“百度解法”

在中国的科技大厂中,百度是最早一批确立AI为核心战略的企业,在过去诸多公开场合中,李彦宏对AI的热情贯穿始终,百度也在“一号位”的带领下,率先自上而下完成AI重构。 

但正如李彦宏在演讲中所说的:“我认为直到今天,中国也好,美国也好,最好的AI原生应用还没出现。”

这句研判并非没有根据。红杉资本在其刷屏报告《生成式AI进入第二阶段 》中提到,当前市场正在进入“第二幕”,一切的炒作最终会被真正的价值和完整的产品体验所取代。 

从全球范围来看,无论如微软、谷歌这样的科技巨头,还是OpenAI这样的独角兽,都在利用AI原生应用夯实自身的护城河,这已是确定性的趋势。微软虽然自己不下场最大模型,但借助和OpenAI的联盟,已完成Office全家桶的AI化,另一边的OpenAI则在最近的开发者大会上,直接推出了GPT Store,呼吁个人与开发者打造自己的专属GPTs。 

也正是这种对技术价值的长期研判,催生出李彦宏的呼吁:“我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型”。 

当价值锚定,剩下就是如何去做,如何真正开启一个健康、繁荣的“AI原生时代”?

事实上,李彦宏与百度想的也非常清楚:这不是一道靠一家或两家企业完成的选择题,而是一道需要多方合力共同参与的开放题。 

首先,拥抱AI时代,必须是一项“一把手、一号位”工程。 在李彦宏看来:“大企业天然保守,对新生事物不敏感,不愿意冒险”。他提到一些行业乱象,比如,很多企业只认为拥抱AI是IT部门的事,要么天马行空地想要从0到1自己去大炼基础模型,要么就只看评测榜单选一个模型,最终的结果只会造成资源浪费。 

如何避免内耗,发挥AI真正的价值,李彦宏给出的解法是企业的“一号位”。这一点也并不难理解。一方面,没有人比一号位更关注新技术对业务关键指标所起的作用,另一方面,只有自上而下的意志传达,形成统一共识,才能实现合力。 

李彦宏是这么说的,百度也是这样做的。 正如上文所提到的,百度率先自上而下完成AI重构的中国企业,不仅是各产品线的AI原生化重构,更是上下意志的统一。 

其次,技术必须服务需求,从具体的行业场景与业务场景找痛点,与技术做结合。 现在很多企业都在陷入一种算力恐慌,但正如李彦宏所说的“无论是芯片也好、框架也好、模型也好,都需要AI应用来驱动。” 

换言之,只有通过更多的场景应用,才能驱动算力和数据步入正循环轨道。 

最后,更好的生态才能催生更多的创新。 中国的大模型厂商不能闭门造车,让AI真正实现普惠必须降低门槛,为更多企业、开发者与个人提供更便捷的工具链与解决方案。 

“百度从做AI的第一天,就非常重视生态的建设”。李彦宏这样说。目前,百度飞桨已拥有800万AI开发者,不久前,百度发布的文心一言插件生态平台“灵境矩阵”,相当于为大模型提供了“手和脚”,插件以一种以轻量化的形式,降低了使用门槛,让用户科技结合自身的业务场景与需求,快速创新,进而真正发挥让大模型的通用能力真正落地于场景。 

插件生态之外,对于一些企业级与行业客户而言,如何让大模型更好地落地产业,关键要让大模型用的顺手、用的长久,百度智能云千帆大模型平台就通过更完善的大模型产品、工具和服务,目前已有超17000家企业在这里开发产业模型和解决方案。 

对李彦宏与百度来说,他们足够熟悉AI,也靠着多年的AI蓄力等来了如今的蜕变重生,在西丽湖上的这份冷思考与热驱动,某种程度上,是李彦宏的真心话,也是百度经历过AI时代完整周期的经验总结与价值理解。

正如Robin在演讲最后所提到的那样: 

“希望每个人都行动起来,去使用它、体验它、投入到AI原生应用的创新中,共同创造一个百花齐放、无限可能的AI原生时代。 ” 

附:李彦宏《AI原生时代:“冷”思考和“热”驱动》演讲实录

尊敬的各位领导、各位嘉宾,大家好!很高兴来深圳参加西丽湖论坛。我想借此机会,跟大家分享我对大模型和AI原生应用的一些思考。我演讲的主题是《AI原生时代:“冷”思考和“热”驱动》。现在人工智能很热,但我想首先分享两个“冷”思考。

第一个,中国的大模型很多,但是基于大模型开发出来的AI原生应用却非常少。有报道说,截止10月份国内已经发布了238个大模型,而6月份的时候这个数字是79个,相当于4个月就翻了3倍。但中国有多少AI原生应用呢?我想在座的各位,很少有人能说出一二个来。如果我们看国外,除了有几十个基础大模型之外,实际上,已经有了上千个AI原生应用,这是在中国市场上没有的。而我认为,人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。为什么这么说?我们看PC时代,基本上只有Windows一个操作系统,但是基于Windows系统开发的软件有很多;移动互联网时代,主流操作系统也只有安卓和iOS两家,而移动应用有800万之多。大模型时代其实也是类似,大模型本身是一个基础底座,类似操作系统,那么最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以,不断地重复开发基础大模型是对社会资源的极大浪费。

AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。如果我们的产业政策能够更加鼓励基于大模型的AI原生应用,我们一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。

第二个冷思考,由于没有智能涌现能力,专用大模型的价值其实非常有限。我看到一个现象,很多行业、企业,甚至很多城市都在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型。殊不知这样炼出来的大模型是没有智能涌现能力的。因为,只有当你的模型的参数规模足够大,训练数据量足够多并且能够不断投入,进行迭代,才能够产生智能涌现,大模型才能具有触类旁通的能力。也就是说,你没教过的东西,它也会了。所以,大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。

自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长。国内有200多个大模型,上了这个榜单、进了那个排名,但其实调用量是很小的。文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。

刚才说了两个“冷”思考。作为一个在AI领域工作超过十年的从业者,我对大模型和AI原生应用的巨大价值和影响力,都深信不疑。所以我想说一说,AI原生时代的三个“热”驱动。

第一,强大的基础模型,会驱动AI原生应用爆发。中国有领先的基础大模型,这是AI原生应用发展的坚实基础,是底层的能力。3 月16日,百度率先发布了基于文心大模型3.0的文心一言产品,之后快速迭代。

上个月,我们又发布了文心4.0版本,在网站和APP上叫做文心一言专业版。4.0是迄今为止最强大的文心大模型,在理解、生成、逻辑和记忆各方面能力,都有了明显提升。比如,在生成能力上,文心一言除了生成文字内容,还包括图片、视频、数字人等等多模态内容,可实现的创作体裁超过200种,你让他写一首李白风格的诗,写出来就像李白,你让他写一首杜甫风格的诗,写出来就像杜甫,涵盖了几乎所有的写作需求。在逻辑和记忆能力上,相比之前的版本也有了成倍的提升。而AI原生应用,就是基于大模型智能涌现后产生的理解、生成、逻辑和记忆能力而开发出来的应用。这些能力是过去的时代所不具备的,因而才能打开无限的创新空间。作为基础底座,大模型可以支撑无数AI原生应用的开发。但是,直到今天,无论是中国也好,美国也好,我认为最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样,AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。而深圳有着丰富的场景和深厚的产业基础,在AI原生时代深圳一定会再次成为创新创业的沃土。

第二,拥抱AI时代,需要由CEO、一把手来驱动。今天,大模型和生成式人工智能所带来的机遇是堪比工业革命的大机遇,这一点已经成为行业的共识,每一家企业、每一个组织,都在思考如何拥抱这个新时代,如何利用这一新技术来提升自己的竞争力。如同任何新鲜事物都有一个接受过程一样,最早接受的是C端用户和创业企业,之后是中小企业,最后接受的才是大企业,因为大企业天然保守,对新生事物不敏感,不愿意冒风险。我见到很多企业,上上下下都非常重视这次机会,但是对问题的本质理解不深,CEO把这个任务交给IT负责人,IT负责人和工程师天天被那些所谓的“震撼发布”、“史诗级的更新”、“iPhone时刻”、“炸裂”这些说法所忽悠,都想去自己搞个基础模型,或者按照网上传播的评测方法来挑选一款评分高的大模型,大家就以为这就是拥抱AI时代了,殊不知大模型本身不仅不产生任何价值,还造成了对公司资源和社会资源的巨大浪费。

拥抱AI时代,为什么需要一把手来驱动?因为只有CEO才会关心新技术对自己业务的关键指标是不是产生了正面作用。比如对于互联网企业来说,大模型有没有对你的DAU、时长、用户留存这些指标产生正面的影响。其实对于所有企业来说,更简单、更直接的是对你的收入和利润增长有没有产生影响,对你成本的降低有没有产生影响。这才是问题的本质。小公司一把手什么都管,就更容易开发出适合自己的原生应用,大公司分工明确,CEO如果不主动引领这个变革,就很容易被带偏。

在百度我们坚决地对旗下各个产品线进行了AI原生的重构,给大家带来了前所未有的智能体验。比如,新搜索具有极致满足、推荐激发和多轮交互的特点,当用户提出一个问题时,新搜索不再是提供一堆链接,而是通过对内容的理解,生成文字、图片、动态图表等多模态的答案,让用户一步获得满足。再比如,以前准备一场演讲,要耗费好几天时间制作讲稿和PPT,刚刚也讲了,写文章3000字可能一分钟就完成了。现在,百度文库可以在1分钟内生成一个20几页的PPT,包括图表生成,格式美化等,成本几乎是零。新文库也实现了从内容工具到生产力工具的转变。因为有了这样的原生化改造,文库的付费率有了明显的提升,这就是我说的AI对业务关键指标的促进作用。更大想象空间在于,大模型催生出过去从来没有过的AI原生应用。百度也在孵化全新的AI原生应用。比如智能代码助手Comate。今天百度有上万个工程师,百度现在每新增100行代码,就有20行是AI生成的,而且这个比例还在快速增长中。这样的AI原生应用,通过人机协同,帮助我们大幅度提升研发效率。而AI原生应用带来的改变,我认为,才刚刚开始。

第三,繁荣的AI原生应用生态,会驱动经济增长。好的应用会带动市场,倒逼市场变化。类比来看,中国新能源车在全球的市场份额达到65%。这主要是因为国家政策的扶持拉动了应用端,拉动了市场的需求,比如对于新能源车的车辆购置税减免,不限号不限行等等这些手段,都有效拉动了新能源汽车产业的快速增长。AI产业也是需求驱动,所以应该是在需求侧、应用层发力,就像补贴新能源汽车用户一样,鼓励企业调用大模型来开发人工智能原生应用,用市场手段推动产业发展。

我之前说,AI时代的技术栈分为四层,也就是芯片层、框架层、模型层和应用层。无论是芯片也好、框架也好、模型也好,都是需要AI应用来驱动的。只有通过更多的场景落地应用,才可以形成更大的数据飞轮,才能够让芯片做到够用、好用。全球来看,AI原生应用正在成为主要的趋势。微软其实并没有自己的基础大模型,它是跟OpenAI合作的,但是它有最成功的AI原生应用,大家知道就是Office365的Copilot,30美金一个月。百度从做AI的第一天起,就非常重视生态的建设,目前已经拥有了超过800万AI开发者。

不久前,百度上线了大模型插件平台,无论是个人还是企业,都可以通过这个平台,把自己的数据和能力,快速地变成插件。比如法律助手、简历助手、装修助手、旅游、办公等等助手类插件。插件是一类特殊的AI原生应用,不仅容易上手,还能让企业在私有数据没有泄露风险的情况下,更便捷地用到大模型的能力,大大降低了开发者门槛,有利于构建繁荣的AI原生应用生态。

API是AI原生应用调用大模型的主要方式。在制造、能源、电力、化工、交通等实体产业,都将成为大模型和AI原生应用极为重要的落脚点,也将成为推动数实融合的主阵地。今天,在百度智能云千帆大模型平台上,已经有超过17000家企业在这里开发产业模型和解决方案,除了刚才提到的行业,也包括教育、电商、短视频、游戏等多个行业。未来,每一家企业跟自己客户打交道的方式,都会转变为AI原生应用,这将大幅度提升企业的竞争力。无论是企业竞争力的提升,还是个人工作效率的提升,都是经济增长的驱动力。AI应用生态的繁荣就会成就经济繁荣。

“纸上得来终觉浅,绝知此事要躬行”。我讲了这么多大模型和AI原生应用,就是希望每个人都行动起来,去使用它、了解它、体验它、投入到AI原生应用的创新中,共同创造一个百花齐放、无限可能的AI原生时代。

谢谢大家!