摘要:应用驱动
文 | 山核桃 无锈钵
“过去这24个月,这种全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?”
11月12日的百度世界大会上,以标志性白衬衫现身的百度集团创始人兼CEO李彦宏在他的演讲开头,就向外界抛出了这一重磅的“大模型之问”。
AI究竟是不是泡沫?
李彦宏和百度对这一“大模型之问”的回答显然很坚定——AI不是泡沫,文心大模型调用量的高速增长印证了这一点。
截至目前,百度文心大模型的日均调用量已超15亿次,相较一年前首次披露的5000万次,增长约30倍,这说明AI是真需求,大模型应用正处于爆发前夜。
李彦宏和百度没有满足于此。在刚刚结束的百度世界大会上,百度发布了最新的检索增强的文生图技术(iRAG)和无代码工具“秒哒”。
未来已来,人们与“AI应用创造世界的距离”,又近了一步。
1、为「超级有用」铺路造桥
“我们不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数以百万‘超级有用’的应用。”
在此次百度世界大会上,李彦宏率先在行业里喊话——“要打造超级有用的应用”的原因所在。
iRAG技术和无代码工具“秒哒”,其实是百度为“加速应用渗透”送上的锤子。
想让大模型落地直接应用、产生实用价值,国内外大模型厂商其中的一个主线任务,就是各出奇招解决大模型的“幻觉问题”。
李彦宏认为, 过去24个月,大模型的最大变化是基本消除了“幻觉” ,这主要得益于RAG(检索增强生成)等技术对模型性能等提升。
RAG技术结合了信息检索和生成的能力,有效提高了大模型文本内容生成的质量,但随着图像等多模态AI的飞速发展,大模型的“幻觉”问题变得越来越复杂,各类文生图模型尽管反复宣称在生成效果上“超越人类设计师”,但在实际使用过程中,用户的翻车体验并不在少数。
在AI生图领域,怎么杀死“幻觉”?关键时刻,还是百度带来了好消息。
据百度CTO王海峰介绍,在今年年初,百度就决定下场通过自研iRAG技术,结合不同应用场景下用户具体的生图需求,解决图像生成的幻觉问题。
王海峰具体介绍了iRAG实现可控生图的技术链路,和此前百度的检索增强技术类似,这依旧是一个“理解-检索-生成”协同优化的过程。
首先,大模型会用户的具体需求进行分析理解,自动规划精确或者泛化的方案,比如对哪些实体进行增强;
其次,在增强阶段,对需要增强的实体进行检索,并选择对应的参考图;
最后,在生成阶段,百度自研了多模态可控生图大模型,一方面,通过局部注意力计算,大模型能在保持实体特征不变的情况下,实现图像的高泛化生成;另一方面,通过整体注意力计算,可实现图像的高精确生成,保持生成图和原图相关物体等元素的一致性。
「财经无忌」以“锤子手机”、“虎皮鸡蛋”等prompt,实测文心一言AI生图功能发现,对比国内其他模型厂商,在iRAG技术加持下,所生成的图片对prompt的理解更准确,图片的生成质量也不错。
左图为其他厂商,右图为文心一言
以人物动作和环境的一致性,我们以“生成一张在玩手机的华妃的图”为需求,也“考了考”文心一言的表现,不到20s文心一言就完成了任务,所生成的图片也与真实世界高度相似,没有什么“AI味儿”。
对prompt的理解、人物一致性、 生成速度都超出我们预期
iRAG技术无幻觉、超真实、低成本、立等可取等一系列优势,这也意味着,小到普通自媒体工作者的图文编辑,大到上市公司宣传海报制作,都有望直接从中受益,AI应用的空间也得以打开。
李彦宏在接受媒体专访时也提到:“多模态要想进入真正实用阶段,也得有准确性,或者说可控性。让你不变就不能变。有了这种能力后,应用空间才能打开”。
除了消除大模型的幻觉,是AI应用爆发的技术前置条件,更关键的是还有找到大模型时代应用落地的载体。
百度瞄准的方向就是就是智能体。
今天,智能体几乎已成为头部大模型厂商探索的“标配”。
麦肯锡报告显示,过去的一年里,Google、OpenAI都将智能体作为大模型最重要的应用场景,OpenAI创始人奥特曼近期采访中提及「5级AGI」蓝图里也反复强调“智能体”的作用:“第三级是智能体,能够执行长期任务,比如与环境多次互动,并与人类协同工作”。
李彦宏认为,智能体相当于 PC 时代的网站和自媒体时代的账号,其特点是门槛低、天花板又足够高。
本质上,智能体是一个更轻量化、更具主动性和更强交互性的AI应用,但对一个毫无编程经验的普通人来说,想要创造一个专属智能体或实现多智能体的协作,依旧有很高的门槛。
而百度的无代码工具“秒哒”的诞生,解决了这一问题,用户只需要向大模型表达出自己所需要的智能体工作流等信息,仅依靠自然语言交互,就可以完成一整套系统的设计、开发、测试。
区别于其他的低代码或无代码开发平台,“秒哒”的特色有两点:一是不局限在程序员等开发者,门槛更低。二是整个应用的开发过程,可实现多智能体的协作。
据王海峰透露,这主要是因为“秒哒”所采用的是智能体的“中心化模式”。
举例来说,如果用户想针对某新技术发布会开发一个嘉宾邀请和管理系统,“秒哒”在受到需求后,“小组长智能体(0号智能体)”进行规划调度,将任务拆解并召唤各智能体来完成任务,策划设计方案会交给“策划智能体”,文字编辑内容会交给“编辑智能体”,网页的代码编写、系统制作和部署由“程序员智能体”完成,最后还有负责质检的智能体,检查和测试代码,并能和其他智能体配合一起改bug。
总结来看, iRAG技术进一步解决大模型的“幻觉”,“秒哒”则是以低门槛的方式让小白轻松上手应用开发,为「超级有用」铺路造桥的百度,其实也为应用爆发打好了基础。
2、祛魅超级应用,从“智能涌现”到“价值涌现”
“国外有一种说法叫‘软件吞噬世界’。但我认为,这个世界不应该被吞噬,而应该被创造。AI时代,应用创造世界。”
在漫长的科技史上,对新技术的质疑,从来都不是什么新鲜话题。
那些“AI泡沫论”的拥趸者,所给出的理由是:“至今未出现一个大模型时代的超级应用”。
这实际陷入了一个“应用误区”——对“超级应用的过度迷恋”。过去两年里,市场涌现出诸多号称“大模型时代的超级应用”,但又迅速衰落,根本原因在于“好看但不有用”,难以与个人、企业的实际场景和需求结合,形成产品迭代的增长飞轮,自然也难以长红。
“如果说2023年大家还在卷模型,让模型能力逐步地达到可用地步的话,那未来所谓的‘可用’,就是真的有东西用。”李彦宏说。
“超级应用”到“超级有用”,一字之差,所对应的是两种完全不同的认知和实践逻辑。
一方面,在认知上强调“有用”更偏向谈生成式AI的落地价值,而不是“为了创新而创新”;另一方面,在实践上强调“有用”是关注用户和企业的实际需求,避免“拿着锤子找钉子”。
在“超级有用”的思路下,再看百度推出iRAG技术和无代码工具“秒哒”,其实有更深远的两重含义:
一是将真技术创新与真需求场景融合,降低普通人实践AI的门槛,打开AI应用落地的规模化空间。
无论是关注幻觉问题的iRAG技术,抑或是让零编程经验的普通人也能手搓智能体的“秒哒”,都是百度结合现有模型能力,将复杂的技术场景留给自己,将最简单的体验留给用户,缩短人们与AI间的距离。
二是在瞬息万变的技术发展中为更多人找到可确定的方法论。在GPT-5迟迟未至,Scaling law放缓的诸多质疑中,李彦宏认为,这对应用层来说是反而是新机遇。
“从应用端来看,技术进步的速度不仅没有放慢,甚至有变快趋势。从另外一个角度来讲,反而是基础模型不能够特别快的迭代,如果老在变,那做应用的人就无所适从了。”
当然,长期来看,在复杂的应用场景里,模型能力的提升依旧还会遵循大力出奇迹的Scaling law或依赖模型精调、数据标注等工程化手段,但在一些相对没有那么复杂的应用场景里,比如代码领域,人们可以借助大模型能力,提升认知、创造价值,这是确定性的趋势。
“我今天能够写两百行代码,一年以后可能能写两千行代码,再过三年可以写两万行代码,这个能力会逐步发展出来,那它会让更多人的创造性给激发出来。”李彦宏说。
而当更多人看见AI产生的实际价值,大模型或许也能从“智能涌现”、“能力涌现”再到最终实现“价值涌现”。
3、中国大模型弯道超车,机会是应用驱动
伴随AI成果的涌现,人们也在关注中国大模型的“未来之问”:
中国大模型产业爆发能否复刻移动互联网时期的辉煌?中国AI公司与硅谷企业相比,又有哪些比较优势?
回到“第一性”原理,李彦宏认为百度就是“应用驱动”。
”美国很多公司一直都是梦想说我要做颠覆性的技术,我更多希望尽早接触场景及接触应用,看在这个过程当中,到底遇到了什么问题,把这些问题带回来,我们综合看一下,大家遇到的最多的问题,就是我们优先解决的问题。“李彦宏解释。
“应用驱动”既是百度的底层战略思考,也是中国大模型弯道超车的优势。
毕竟,从移动互联网时代开始,中国就诞生出诸多超级应用,在技术落地的终端入口上,中国同样也是全球最大的消费电子生产国、出口国和消费国。在迭代的技术革命主题背后,将技术创新与市场需求结合,落地用户端的应用,这一直都是中国厂商的优势和机遇所在。
近期,由弗若斯特沙利文发布的《2024年全球AI生态全景概览》中,百度也和 OpenAI、谷歌一起,成为了全球唯三被该机构承认的“AI 原生巨头”。
作为中国唯一一个榜上有名的公司,这份榜单恰好给出了我们答案:中国大模型弯道超车,机会就在应用驱动。
关于应用的故事,李彦宏和百度显然瞄准的是AI的长期主义,十二年前,投身AI浪潮的百度选择成为彼时AI火种的传播者时,没人能想到这场“应用来了”的浪潮或许将改变每个参与者的命运。
现在,他们继续沿着这条路行走,李彦宏将人工智能比喻成“一次新的工业革命”:“这意味着它不是三五年就结束,不是一两年就出现‘超级应用’的过程,它更像是三五十年对于整个社会的方方面面一个非常彻底的重构。”
拉长科技史,无论是微软谷歌,抑或是如今的英伟达,那些将经历放在专“技术是否真的有用”的科技巨头也都收获了时间的玫瑰,或许如李彦宏所言“我们即将迎来AI应用的群星闪耀时刻”,而中国大模型,也有望借助应用驱动,讲述更多的新故事。