大模型落地卡在哪?讯飞星火解出三道题

摘要:国产大模型跑出一条有特色的超车弯道。

国产大模型跑出一条有特色的超车弯道。

@科技新知 原创

作者丨茯神编辑丨赛柯

ChatGPT横空出世500天之后,OpenAI再给国内赶潮大模型的从业者泼了一盆冷水。

从一直未能开放的中国用户注册和服务,到如今关闭来自国内开发者的API接口,领先者的冷漠让人们感受到残酷,却更加清醒。大模型这个未来潜力广阔的赛道上,国产替代已经迫在眉睫。

然而,底层基础设施上的先发优势,容不得忽略。当初惊艳的GPT-3.5现已升级到了强大的GPT-4,一年后可能还会随时冒出,参数规模预计达到52万亿级别的GPT-5。中国后辈们数次无限拉近身位,但终究落后一筹。

想要弯道超车,国产大模型们只能从自身出发,走出一条中国特色的大模型之路。那些在PC和移动互联网时代,脱胎于10亿以上触网人群和海量丰富的场景数据,积累下来的产品和应用经验,将成为效率最高的加速燃料。

2024年的国产大模型竞赛,考较的就是“落地与应用”这道开放式必答题。创新工场董事长李开复日前在公开场合中就称,中国AI大模型已经进入到落地为王的阶段,今年会迎来大模型应用爆发元年。

作为种子考生之一,科大讯飞旗下的讯飞星火大模型,从去年诞生之初,就把对标以及超越GPT系列当作目标。它以每月都有小升级,半年就有大版本的迭代速度,稳稳走在同行前列,紧紧咬住OpenAI,不负大模型“国家队”之名。

6月27日在北京的国家会议中心,讯飞星火大模型的4.0版本又如期亮相,自主可控的底层技术、软硬多端的产品序列、丰富多元的场景应用,成为让人眼前一亮的关键词,也组合成一份堪称模板的大模型落地赛参考答案,值得同届考生们汲取灵感。

Part.1

答题先拆题

见题先拆题,是学霸们常用的应考策略。

国产大模型们想要在今年的落地赛中脱颖而出,就必须认识到目前横亘在眼前的三座大山:高能耗的算力成本、多环节的技术适配,以及产品化的需求定制。

大模型的尽头是能源,这不是一句笑谈。支撑通用大模型实时运算生成反馈内容的正是背后最先进的无限算力。根据第三方数据机构SemiAnalysis的评估,OpenAI已经使用了约3617台HGX A100服务器,其中包含了采购自英伟达的近3万个GPU。

有媒体曾作出测算,英伟达新一代DGX系列服务器可整合8张A100共同工作,最大功率是6.5kW,这意味着其运行一小时会消耗6.5度电,同时还需要搭配大约同等电量的散热设备。假如按照平均工业用电每度0.63元的标准,1台服务器工作1天的电费约200元,当规模上升到1000台时,一天的电费就高达约20万元。

当然,更多的大模型创业公司选择了,把自家产品部署在云服务器厂商的平台之上。这也导致微软一边不计成本地投入OpenAI,另一边在云业务上收获颇丰。但小公司寄人篱下,产品和服务又不得不面临着自主性和安全性的考验。

翻过成本大山之后,还有技术适配和需求定制两道关卡。

从OpenAI实验室中走出来的大型语言模型技术,早在2017年关注和立项,直到2022年底才在ChatGPT上大放异彩举世瞩目。科技成果的转化落地不仅离不开时间上的沉淀,更需要开发产品联接市场的企业们发挥能动性。

GPT给国产大模型们指明了一个方向,却不能提供数亿规模的中文语料,更不懂国内已经摸不着石头,走入“无人区”的工业和信息化行业。而打破这些市场、行业、企业之间的流通隔阂,引导技术一步步适配转化落地的工作,才是后者需要努力攻坚,一分高下的主战场之一。

基于中文语系的大模型,只是能够在国内市场上落地,完整的商业闭环还少不了可变现的产品化定制。如果停在这最后一道门前,国产大模型只会沦为千篇一律的类ChatGPT模式,用户们看到的只有一个在搜索引擎上见惯了的输入框。

微软、谷歌这些国外的大模型领先者,都在尝试把技术融入到自己传统的办公、搜索产品当中,国产大模型们更应该发挥自身优势,提前做好下游产品的需求挖掘和定制规划。而这个过程中,那些本身已具备深厚的AI类产品经验和市场积累的玩家,与考前押中一道大题简直无异。

以上大模型落地赛的三个难点,既是门槛又何尝不是机遇。刚刚发布的讯飞星火V4.0,就展示出其各种转危为机的倒推式解题手法。

Part.2

倒推法解题

倒推式解题法是数学竞赛中常用的解题思路,考验的是答题者的逆向思维运用。面对市场给出的商业化大题,企业们采用倒推,从客户或用户的需求出发,也不失为走出困境的良策。

讯飞星火V4.0的发布,给予自己的定位就是倒推得来。正在逐步走进的AI时代,人们最需要的终极AI产品会是什么形态?不少科幻电影中其实已经给出答案,就像《钢铁侠》系列中的超级智能管家“贾维斯”一样。

贾维斯能够在钢铁侠的工作、生活甚至拯救世界的过程中无缝切换、无微不至,讯飞星火V4.0就提出要做一个在你身边,时刻懂你的AI助手。

面向C端,讯飞星火V4.0做到了懂用户。它没有只给用户一个冰冷的输入框,而是在APP中细分为写作、编程、工作、学习、生活、亲子、翻译等各种各样的助手,让用户需求与场景自然融合,大大降低操作门槛。

正因如此,自去年9月讯飞星火正式全民开放后,仅可统计到的安卓渠道下载量已经累计1.31亿次,部分高频场景的用户使用次数也达到了数百万甚至数千万次。

最新的版本中,为了实现千人千面的用户体验,讯飞星火加入了人设模板,可以一键设置个人助手的表达风格;用户如果想要打造只属于自己的个性化助手,只需要在“个人空间”中上传自己的工作、生活、学习等资料,再选择性地结合外部信息一并参考,就能生成万千人海中独一无二的存在。看来仅是懂用户还不够,要有针对性地懂每一个用户,才是讯飞星火的追求。

不仅是手机端的APP,由星火大模型在后台赋能的讯飞智能助听器,让湖北的一位老年用户从听力受损的状态中摆脱,既能智能检测听力状态,又能精准过滤背景噪音提升有效信息音量。一个懂你的AI助手,甚至能改变一个人的生活轨迹。

面向B端,讯飞星火V4.0做到了懂企业。星火大模型为了解决企业大模型应用的“最后一公里”问题,选择用智能体平台打造专属于每个岗位的工作助手。

复杂的企业需求不能用简单的一句话去概括,但可以在清晰地认识到大模型能力的边界后,把不同难度的任务分解成原子化的独立需求,分别完成后再进行串联整合。

如此搭建出来的企业智能体平台,是建立在科大讯飞的AI原子能力、外部信源集成,以及企业内部的IT系统打通等基础之上的。目前的星火企业智能平台已经覆盖到首批32个企业从生产、科研、办公到管理中特别需要的相关智能体,如商机、销售、客服、科技情报以及编程等。其中表现突出的代码智能体iFlyCode,已经赶上了现在GPT-4 Turbo的最新水平。

从不同终端场景中的需求出发,讯飞星火V4.0没有粗暴地统一标准对待,而是仔细分类、认真匹配,但想要高效地满足需求仍离不开底层大模型技术的扎实过硬。

软硬一体、自主可控是科大讯飞在大模型之路上追求的目标。去年10月,在科大讯飞提供大量算子库和算法资源的基础上,华为开发出国内首个国产万卡算力集群“飞星一号”。星火大模型就是借此训练而成,每一行代码、每一个数据都牢牢握在中国人手里,还获得国家网信办等八个部委联合认证。

如今升级到4.0版本的讯飞星火,已经成功对标了目前最好的通用认知大模型GPT-4 Turbo,甚至在文本生成、语言理解、知识问答、逻辑推理、数学等能力上实现超越,不过在代码和多模态能力上还有差距,但在复杂指令的表现中又明显领先。

先弄清楚市场真正想要什么,再设计出符合需求的产品形态,最后为了达到产品目标,花大力气自主科研,这条自下而上倒推的国产大模型之路,算是给今年的落地赛写下了一份可参考的答案。

Part.3

解法成共识

讯飞星火V4.0的发布,或许会成为国产大模型500余天征程路上的一道分水岭。其所展露出的重视用户、强调价值等理念,已经见到市场上愈来愈多的同行跟上。

蓦然回首,2023年的“百模大战”恍如隔世。仅仅在2022年底ChatGPT发布几个月后,国内宣布跟进大模型赛道的互联网大厂和初创企业,就已经超过了100个之多。

为了尽快问世自己的产品,或者拿出能够比肩ChatGPT的有效证明,参数级别和算力规模成为众多企业争相比拼的关键。有英伟达在国内的供应商曾对外表示,一年之内,A100芯片市场上的售价就翻了一倍,主要的大客户涵盖了腾讯、百度、字节跳动、阿里巴巴等互联网巨头,而创业公司较少。

毕竟资本市场更加青睐快速验证的轻资产模式,大笔现金烧向底层基础设施,远远没有快速落地产品试水市场,来得划算。红杉资本去年就曾撰文《生成式 AI 的第二幕》称,目前生成式 AI 应用的最大问题,是需要证明自身的价值,因为目前基于基础大模型开发的应用用户留存率明显不够。

大厂们的动作不可谓不快。阿里巴巴内部孵化出的爆款应用妙鸭相机,一度在社交媒体上刷屏;字节跳动旗下的豆包APP,也从上线初就非常注重拟人化的体验;科大讯飞更是凭借多年在AI产品和服务领域积累的经验,不仅推出讯飞星火APP,还把星火大模型内嵌到汽车、家电、教育、医疗等场景当中,让用户看不见却用得着。

C端卷的是应用,B端卷的就是客户。

今年5月初,央企龙头中国石油集团就传出要加快数字化建设的步伐,随后集团领导先后邀请百度李彦宏、科大讯飞刘庆峰交流会谈,大有广纳业内贤才良言之意。最终在月底的昆仑大模型建设研讨会上,中国石油选定的合作对象由中国移动、华为、科大讯飞强强联手,组成了一支能源化工领域的人工智能“国家队”。而百度虽也早先赢得与中国石油管道局设计院的合作,却在这次工业大模型之争中遗憾略逊。

竞争不会停歇,还要放眼未来。随着技术与行业之争的白热化,国家层面引导扶持的介入,也是一股不可小觑的力量。比如从2017年开始多次改革的国家科学技术奖,更为强调国家战略导向和与重大战略需求的紧密结合。

就在这逐年趋严的背景下,2023年的国家科学技术奖评选中,华为、阿里云、科大讯飞、小米等科技巨头纷纷上榜,其中科大讯飞又凭借“多语种智能语音关键技术及产业化”项目,斩获国家科学技术进步奖一等奖,成为近十年来AI领域首个获此殊荣的企业。

国产大模型们之争还远远没到终局的时候,仅是目前的落地赛,也不是一次交卷定输赢。讯飞星火V4.0的发布,走在了行业前面,更要耐得住同行的奋力追赶。未来的大模型不管再会卷向何方,但都不会背离商业化市场的本质规律,那就是拼技术积累、拼用户规模、拼客户实力、拼社会认可。这可能就是讯飞星火一直都能领先一点的秘籍所在。