复制成功

分享至

主页 > 数字货币 >

vivo X100系列的蓝心小V是我用过的最“合身”的大语言模型

2023.12.28

原文来源:硅基立场

作者|骆轶航

vivo X100系列的蓝心小V是我用过的最“合身”的大语言模型

图片来源:由无界 AI‌生成

这是我体验过的第一个由智能手机厂商自主研发的大语言模型——vivo推出的基于蓝心大模型的“蓝心小V”。作为“大模型神农”,我最近测试任何一个模型服务之前都会提醒自己“降低预期”,特别是对那些视频拍得过于酷炫的demo。但对蓝心大模型,我的感觉是:合乎预期。它不算酷炫,但还算实用。

作为智能手机厂商推出的大语言模型,人们通常认为它不会太大,参数较低,涌现效果可能不会太出色,理解一些复杂文本和意图会出bug。但我从蓝心大模型中得到的体验是相反的:它展现了创作和总结方面强大的推理能力,可以达到80分以上,反倒是在基础的搜图和常规写作等方面的表现中乘。

要知道,目前vivo X100系列手机上搭载的蓝心大模型是专门面向手机打造的端侧场景和云端两用模型,远没有千亿级参数的大模型那么“大”。但当我丢给它一篇关于大模型的涌现现象是否真实存在的文章时,它十分精准地找到了里面最关键最核心的那个论点:大模型涌现能力产生是研究者选择的度量标准而并非模型能力扩展的结果,所以并不是真正的“智能涌现”。

vivo X100系列的蓝心小V是我用过的最“合身”的大语言模型

这确实有点让我震撼。因为“读文档”对大语言模型来说,是一个有些难度系数的工作,不是哪个模型都读得好的。比如ChatGPT近期阅读复杂冗长PDF文件的能力就发生了惊人的退化,尤其是在概括力上。但蓝心大模型的蓝心小V能一下子找到最关键的论点。值得一提的是,在测试的时候,我特别勾选的是“本地总结”的功能,完全在用这台vivo X100机器自身的算力(联发科天玑9300)和推理能力进行总结,它某种程度上打破了“大模型必须得大”的固有认知。

接着,我发现了一个更有意思的现象:当你把一篇更长的论文上传给蓝心大模型之后,它依然能提炼出最关键和最重要的观点和发现,但延展叙述往往草率几句话了事,“好读书而不求甚解”。它与一些其它的大模型Chat Bot在阅读理解能力上形成了反差:很多模型拆解信息能力强,提炼概括能力不够。蓝心大模型是概括提炼得无比精准,但不愿意拆解细读,不愿意浪费token在解释问题上,这应该是跟模型大小密切相关的。

vivo X100系列的蓝心小V是我用过的最“合身”的大语言模型

在手机本地的照片搜索、影像查找方面,蓝心大模型的响应速度堪称丝般顺滑,比如在一秒之内找到手机本地存储的所有“关于故宫的照片”。在旅游攻略书写等方面,它的表现中规中矩。在图像创作上,它画的故宫、牛肉拉面、麻辣香锅都能接近ChatGPT的DALL-E的水准,但在想象力上不如ChatGPT丰富,画不出特别疯狂开脑洞的图来。不过,在我让它画“一个AI深沉地思考人类的未来”的时候,它竟然给了我一张有着如此这般意境的图片。

vivo X100系列的蓝心小V是我用过的最“合身”的大语言模型

此外,蓝心大模型通过自然对话操控APP的能力是显著的。我跟它说我想点麻辣香锅的外卖,它会告诉你这台新手机上没有安装美团,当你同意它安装之后,它会到应用商店自动下载美团APP。然后,帮你打开到都是“麻辣香锅”的页面。当然你可以认为,苹果Siri也做的到,因为作为系统底层助手级应用,调取这部手机上的权限是轻而易举的。但区别是,Siri只能接受非常清晰的指令来打开哪个app,面对一个笼统的自然语言需求是无能为力的,它是一个嵌入式的智能语音模块,但蓝心小V在蓝心大模型的加持下,已经算是一个有自然语言理解能力的Copilot了。

总之,几个关键功能调教下来,你会有一个比较确信的方向和判断,那就是端侧大模型这件事是成立的,是靠谱的。而且,端侧大模型甚至整个大语言模型落地到千家万户和芸芸众生,可能还是得靠手机厂商,无论你愿意不愿意。

某种程度上,适配手机的大模型其实更接近微软最近强调的“小语言模型”,它的参数通常不能超过100亿,否则手机内存跑不起来,这也意味着它只能进行特定方面的训练,或把一个模型训练到某种输出程度,然后打住。对于绝大多数人来说,这就足够用了。近期大火的巴黎创业公司Mistral AI,就是这么一家小模型公司。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier