摘要:月之暗面,似乎又一次悄悄领先了。
作者|陶然 编辑|魏晓
上半年爆火的Kimi大模型,进行了一次小而美的更新。
在谷歌Chrome和微软Bing两大主流浏览器中,上线了名为Kimi浏览器助手/ Kimi Copilot 的浏览器插件。
浏览器插件?在这个通用大模型军备竞赛的年份,算不上是个热门赛道。
并且,仅看介绍文案,Kimi的插件似乎也只是一个功能的扩展,AI搜索、总结网页和摘要功能,横向比较在2024年神仙打架的众多模型,甚至算不上新功能。
但,短短几天,这个由月之暗面提供的官方插件,迅速进入了Bing浏览器的热门范围(不过这个热门实际上是个性化推荐,不同用户的热门未必相同),且在圈内热度颇高。
在讨论区,一众网友都是这么评价的:
浏览器助手,是什么?Kimi做了什么,让这个插件这么神奇?
传统打工人的上班搭子,来了?
浏览器插件,大部分是一些应用在网页中的小功能,蓝媒君仅有的几个浏览器插件,基本也就是广告拦截、视频调节和PDF编辑。
但Kimi做的这个插件,有一点特别。
特别好用——浏览器插件包含三个功能,分别是文本划线提问、文本摘要总结,以及设置Kimi常驻网页侧边栏。
在Bing/Chrome浏览器添加扩展之后,网页(默认页面右下角,可自由拖动)中会出现一个圆形的Kimi小图标,表明插件已经处于启用状态。
这时候,在网页中高亮任意文字,鼠标移动到高亮部分时也会弹出一个Kimi小图标,点一下图标,Kimi插件将自动调用大模型的AI能力,帮你解释这部分文字。
并且,还能自动浏览上下文,帮用户总结出一大段文字的主要内容。
不过略显遗憾的是,目前版本的Kimi浏览器助手,数据库更新得似乎还不太及时,并不具备像一众AI搜索应用那样全网检索资讯的能力,更像是大模型加持的百科全书。
Kimi插件并不知道
GPT-4o已经发布了
第二项功能“文本摘要总结”,则是对Kimi擅长的长文本处理,做了一点点拓展。
点击右下角Kimi图标,网页中会弹出一个对话框:输入框让用户提出需求,以及一个“总结全文”功能的预设按键。
直接将一篇万字访谈录甩给Kimi测试:不用选中任何内容,直接在页面点击总结全文,Kimi短时间内就迅速生成了一段500字的总结,概述访谈内容后又分点整理了几个主要话题。
阅读长文本这个功能说起来并不新鲜,国内很多大模型的本体,实际上已经卷到了几十万甚至上百万字符的水平。
但Kimi这个插件被安排在网页中之后,不可避免会有遇到很多无效的干扰信息,比如资讯类相关侧边榜单,或者其他同类型文章的推荐链接,都以文字的形式同时出现在页面中,内容由于算法很可能也都是相似的。
这就需要大模型对页面中的文本种类进行识别和分区,哪些是连贯的文章内容,哪些是和文章本体无关的其他文本内容。
不管是通过页面布局还是通过文字前后关系,总之Kimi在识别文章主体这一项做的挑不出问题,对文章内容的概括能力也依然在线。
而第三个功能“Kimi侧边栏常驻”,则不像前两项一样有相对具体的使用场景——Kimi提供了另一种调用Kimi的方案,让大模型常驻在网页的侧边栏,省去了来回切换网页的时间。
在插件界面从全局浮窗切换到侧边栏模式之后,点击右下角Kimi图标,大模型将自动出现在屏幕右侧,用户可以直接对Kimi提问网页中的内容,或者要求Kimi搜索其他地方的信息。
当然,由于这部分功能调用的是Kimi大模型本体(和网页版Kimi和手机APP互通),好处是能在手机和网页端同步搜索内容,但高峰时段也绕不开算力墙。
“好用”是一种能力
对比很多通用大模型的版本迭代,或是隔段时间就有的新功能重磅发布,Kimi这次更新浏览器插件,只能算是一次“小更”。
并未像之前在B站等平台投流那样大肆宣传推广,似乎只是月之暗面的开发者搞了一个实用工具,没什么bug就开放给用户体验了。
但这个小插件,确实带来了一些改变,至少是改变的可能:
对部分用户使用大模型习惯和流程的改变。
体验完三个功能后,虽然有时提供的内容比较局限,算力墙的问题看上去短时间也没法破除,但Kimi这个插件给蓝媒君带来的直观感受就是,很方便,很好用。
以往在PC端,阅读过程中如果需要借助大模型搜索某个问题,流程一般都是把要查的内容节选出来,复制粘贴或者再编辑一下问题,打开大模型官网粘过去,然后再把内容复制下来到某个文档里比对,或者在网页之间来回切换着看。
这样做是OK的,和现在这种直接在网页内部调用小窗Kimi的模式,得到的内容大差不差,但有差距的地方,就是使用上的便捷程度,是用户体验。
这一点,非常直观。
安装插件后,不需要切换网页来回比对了,直接划线从小窗里查资料,在侧边栏输入需要大模型解答的问题,效率的提高带来了体验的极大提升。
在蓝媒君看来,这个插件的上线,带来的变化绝不是本就很火的Kimi,又多了一个入口。而是精准切中了蓝媒君这种还没完全转到用大模型处理信息,浏览器使用频率依然很高的打工人的痛点。
让这部分打工人能够更流畅、更方便地调用大模型能力,对于厂家来说就是让产品离目标用户更近了。
今年苹果WWDC上线的Apple Intelligence,智能写作、AI邮件、文本总结等等功能,其实也都是安卓阵营早就做出来的功能,
而苹果AI的讨论度依然很高,反响依然不错。一方面能力上苹果和OpenAI的合作确实技术力领先,另一方面,在形式上,可以看出苹果是真正将AI能力塞进了日常的用户使用习惯中间,而不是新增一个APP,新增一个设备让用户多一道手续。
Apple Intelligence的写作工具在用户打字、回邮件或者阅读的过程中,都可以主动调用AI能力辅助,相当于一个趁手的AI工具就在屏幕旁边垂手可得,不用再到处找看怎么使用、合不合适。这种logo常驻带来的存在感,也算得上一种营销。
把能力强的应用,做得“好用”,本身就是一种能力。而在这方面,Kimi大模型的这个浏览器插件,显然可以给到一个高分。
来源|AI蓝媒汇 作者|陶然