AI2.0时代,为何说商汤的价值需要重新审视

摘要:让AI变得足够通用,成为数字时代的“水电煤”

文 | 萧田

如果把时钟拨到2022年底,当我们回过头来看当下科技界最激动人心的大事件,OpenAI于2022年11月推出的新型AI聊天机器人工具ChatGPT无疑会占据一席之地。

一个共识是,大模型和大算力的融合创新,正在掀起生产范式的重大转变,推动通用人工智能(AGI)时代的到来。

ChatGPT及类ChatGPT产品底层基础设施的大模型将带来比移动互联网时代大十倍的机会,穿透各行各业极大地提振生产力。

也因此,越来越多的企业开始关注并投入到大模型的研发之中。

但不可否认,在技术快速迭代的发展初期阶段,如何构建新一代的基础设施,降低应用门槛、缩短研发周期、提高创新效率,也成为政府和产业上下游需要共同解决的新挑战。

6月2日,商汤科技深度参与以“AI引领时代,算力驱动未来”为主题的“临港新片区智算大会”。

会上,商汤科技董事长兼CEO徐立围绕“算力的价值”,分享了过去短短半年里商汤大装置在气象预测、自动驾驶、遥感、游戏以及大语言模型等众多领域取得的一系列突破性成就。

这次大会不仅再度掀起计算机科学领域通用人工智能(AGI)研究热潮,也刷新了我们对这家公司乃至AI的认知。

大模型“百花齐放”,为何离不开商汤大装置这篇沃土?

在ChatGPT的风靡之下,国产厂商纷纷推出自家大模型。自百度于3月份发布文心一言后,阿里巴巴推出通义千问、华为发布盘古NLP模型、腾讯推出混元,还有科大讯飞、字节跳动、出门问问等厂商也紧随其后,呈现出百花齐放的态势。

尤其是在4月10日,作为国内AI领域领头羊的商汤发布了“日日新SenseNova”大模型体系后,全球中期气象预报AI大模型“风乌”大模型、SenseEarth3.0遥感大模型、通才AI智能体GITMl等陆续发布。而且这些突破性成就,仅在一个多月时间内取得,可谓日日新,日日强。

这背后离不开商汤前瞻性打造了软硬结合的AI基础设施大装置SenseCore,推进自身AGI发展战略的同时,也为行业提供大模型算法服务、训练和推理优化以及数据服务。

如果以大模型为坐标系来看当下人工智能的发展,从深度学习到大模型,从标注数据训练到基于自监督学习的非标注数据训练,技术的发展就像一场接力赛,然后在最近达到了一个临界点。

换而言之,人工智能产业的发展并非是一蹴而就的,技术才是“硬”道理。是否拥有大模型与大算力是衡量一家人工智能企业能力的主要标准。

而商汤无疑是其中的佼佼者。

在算力层面 ,经过5年探索,商汤科技人工智能计算中心(AIDC)去年在上海临港正式投用,成为商汤大装置SenseCore的重要算力基座。

大装置上总共有27000块的GPU芯片卡,可以输出5.0exaFLOPS的总算力,支持20个千亿参数超大模型同时训练,大模型并行训练服务支持单集群3200卡5000亿稠密参数模型训练。

这是亚洲目前最大的智能计算平台之一,也是国内为数不多接近GPT所需算力的重要基础设施。

如今,大算力成为了商汤在人工智能“大基础设施”上储备多年的突出优势,但在商汤看来,人工智能基础设施包括了算力、数据、算法三位一体,缺一不可。

正如商汤科技联合创始人、大装置事业群总裁杨帆指出,“大模型并非单纯的暴力美学,背后是大量的软件工程系统问题,商汤大装置长期沉淀了大量的专家认知和工具,具备端到端产品应用解决方案能力。”

在算法层面 ,商汤经过多年人才和技术积累,从小模型到大模型的研发,不遗余力的在各行各业积累了大量的know-how。

比如,在大模型算法研发上,商汤视觉大模型超过300亿参数,领先Google ViT-G、Meta SEER 10B等国外企业,在AIGC大模型、NLP大模型、Nerf三维大模型等领域大模型上也已经形成了一定的应用闭环。

更为重要的是,在AI大模型时代,模型参数量将以指数级速率提升,而数据量随着多模态的引入也将大规模增长,由此带来了对算力需求的剧增。

作为AGI时代基础设施领导者,商汤大装置致力于打造高效率、低成本、规模化的下一代AI基础设施与服务,赋能人工智能生产新范式。在大模型的“百花齐放”的当下,俨然是赋能AI大模型“日日刷新”的沃土。

驱动生产力变革,“商汤速度”解锁AGI更多可能

如果在互联网时代,每个行业都值得用互联网重做一次,那么在大模型时代,每个行业依然如此,甚至此前在互联网时代依然保守的赛道,极有可能被大模型重塑。

因为大模型的价值,从一开始就是重构传统的生产力。这也是为什么商汤一如既往地坚定投入在迈向通用人工智能的前沿研发与商业化进程中。

会上,徐立以大语言模型领域“商汤商量SenseChat”为例,其相比发布时有了诸多长足进步,目前包括多语言能力叠加表格生成处理能力、历史知识能力和归纳能力、多轮对话和长文本理解能力等取得多方面提升。

比如,商汤基于“商量”专门研发的AI辅助开发工具“AI代码助手”,来帮助开发者完成测试代码生成、代码翻译、代码修正等任务。经过一个月的快速迭代,商汤AI代码助手已经实现619%的推理效率提升,可以在相同算力资源下支持6倍的用户数量,大大降低使用成本。

对商汤而言,“商汤商量SenseChat”出色的表现,仅仅是大装置赋能大模型迭代和处理能力日日更新的“冰山一角”。 在大装置的赋能下,商汤在大模型领域实现了日新月异的飞速发展。

比如人工智能赋能基础科学, 在气象气候预报任务中,全球中期天气预报是最重要的预测任务之一,同时理解地球本身复杂系统的一个运行,也是人类的最终极目标。

今年4月,商汤联合发布的全球中期气象预报AI大模型“风乌”首次实现在高分辨率上对核心大气变量进行超过10天的有效预报,且在80%的评估指标上优于DeepMind GraphCast模型。

而得益于对高分辨率全球大气数据建模,不仅可以解决一些突发的天气预报预测,还能准确预测台风轨迹。可以说,“风乌”在帮助人类理解气象上迈出了一大步。

除此以外,开源书生2.5模型,在检测、分割、分类三大主流视觉任务下二十多个权威数据集上全面领先。可以为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

SenseEarth3.0遥感大模型拥有业内最全的解译类别,且在解译效率、泛化能力、解译精度等众多指标上均实现了技术突破。

商汤近日还推出了通才AI智能体GITM,其能够在紧密模拟真实世界的畅销游戏《我的世界》中做到像人类一样生存、探索和创造,并在主世界所有技术挑战上实现了100%的任务覆盖率,在标准任务“获取钻石”上,较目前最佳成绩提升47.5%。

可预见的是,在大模型百花齐放的时代里,必然会导致对算力需求的剧增。

在这场算力的风暴中,商汤以商汤大装置SenseCore打造AGI时代的基础设施,在模型的迭代速度及处理问题的能力上日日更新,不断解锁AGI的更多可能。

未来,随着大模型带来的生产力变革,商汤在底层能力的突破不仅可以为更多企业实现控制成本和提升效率,长期来看,必然带来上层应用的跃迁和变革。

拥抱“大模型+大算力”,商汤勾勒无限想象空间

技术要与产业融合才能打开新市场,产业需要引入技术才能焕发新活力。

早在6年前,商汤就开始探索AI落地的另一种可能性——变身“AI工厂”,走AI平台的路径。让AI变得足够通用,成为数字时代的“水电煤”。

这是一条“几乎没有人走的路”,也是一条艰难而长期的路。“孤独者”商汤选择孤注一掷,大装置才因此而生。

对于此刻的商汤,大模型的火热给商汤一个机会——不仅让自己多年的技术投入成果被更多人看见,也让商汤以通用人工智能引发新一轮范式革新,不断推动传统产业的数字化升级,站在浪潮之巅。

以汽车行业为例,7年里,商汤绝影智能汽车平台的落地商用持续加速。2022年,智能汽车板块实现收入同比增长了58.9%,占集团的总收入从2021年的3.9%上升至2022年的7.7%。

财报显示,2022年,商汤量产收入大幅提高,量产交付数量超50万,新增定点数超800万辆。绝影智能车舱和智能驾驶产品完成了27款车型的适配和量产交付,量产交付数量超过50万。绝影主要客户包括广汽、蔚来、比亚迪、长安等30多家车企。

一句话可以总结:商汤绝影在智能化的进展卓有成效,且不断加速。

当下,人工智能正在从单一智能向通用智能发展,而通用模型的出现,能够实现不同行业之间的融合以及产品和场景应用的创新。

在大会上,徐立就着重介绍了商汤今年4月发布的感知决策一体化的端到端自动驾驶解决方案UniAD。

基于日日新大模型体系,商汤一改过去传统的无人驾驶路径解决方案,将环视的图像通过Transformer映射得到BEV的特征,将感知、决策、规划在整体上做到了端到端的优化,能够用一个统一的通用模型来解决不同的模态问题。

也正是基于这样的解决方案,商汤在多项关键数据集与指标上超越了SOTA方法。使得车道线的预测准确率提升了30%,预测运动位移的误差降低了近40%,规划误差降低了近30%。

值得一提的是,汽车行业正在面临百年未有之大变革,基于感知、决策规控和AI 云三大核心能力,商汤“大模型+大算力”已赋能绝影驾、舱、云三位一体产品体系量产落地。

未来,车和模型之间能够产生更有效的互动,从而完成从人到车、到模型的互动闭环,通用人工智能可为人们提供更好的驾乘体验,解锁无限的想象空间。

在人工智能领域没有弯道超车,有的只是埋头苦干和脚踏实地。

商汤能够在激烈的竞争中持续取得领导者地位,离不开一直秉持着的“一平台四支柱”战略布局,即基于人工智能基础设施商汤大装置SenseCore,持续推进AI技术在智能汽车、智慧生活、智慧商业、智慧城市领域的落地赋能,加速实现行业的智能化升级。

事实上,截至今年5月,商汤大装置已累计服务超40个核心客户,其中大模型客户10家以上,涵盖智能驾驶、生物制药、芯片设计、智慧商业、高校科研等前沿领域,并已在超过20个落地场景中实现大模型交付。

面向更长远的未来,全面拥抱“大模型+大算力”的商汤,将不仅推动AGI在智能汽车这一纵深领域的产业演进,还将持续赋能百业,帮助人类实现更美好的生活。