复制成功

分享至

主页 > 数字货币 >

把大模型装进手机,总共分几步?

2023.11.15

原文来源:脑极体

把大模型装进手机,总共分几步?

图片来源:由无界 AI生成

年初ChatGPT爆火的时候,我去上海参加华为春季新品发布会,用一页keynote提到了大模型技术与手机硬件的结合。虽然只有短短的一两分钟,但我专门发了一条朋友圈,看好自然语言交互能力在手机上的应用。

把大模型装进手机,总共分几步?

当时我就有预感,大语言模型跟手机结合,应该会很快。

时间拉回到现在,苹果、三星,以及“华米OV”国产手机厂商,都先后宣布了落地大模型。对手机来说,有没有大模型,已经不是一道选择题了,而是一道必答题。

提起这段故事,不是想说我们预判有多准,做科技观察不是玄学算命,一切都是有规律可循的。2023即将尾声,但大模型手机的热闹方兴未艾,是时候总结性地聊一聊,手机和大模型结合的深层逻辑,目前各家的差异化打法和挑战是什么,以及未来会如何发展。


2023,手机大模型的基建元年


首先有必要解释一下,为什么我们会预判,大模型与手机的结合,是一种必然?

了解手机市场近况的读者应该知道,在辉煌了十余年之后,移动智能终端已经陷入了某种瓶颈,增长低迷、缺少亮点,厂商创新如同挤牙膏,开发者巧妇难为无米之炊,可施展的创意空间有限。与此同时,一个用户身边至少环绕着三四个移动设备,每天要为繁琐交互,付出大量的隐形劳动,甚至有人不胜其烦,开始尝试“数字戒断”。

可以说,移动数字服务的供需双方,都在期待一种新的变革技术,可以让移动智能终端生态化繁为简、重塑体验。而在今天的技术世界中,大模型是最佳选项。

大语言模型的强大理解和生成能力,各种功能用同一个模型基座和自然语言交互来获取,可以改变手机的多个基本能力,说是重新定义手机,也不为过。

让大模型跑在手机上,成了手机厂商的必争之地,开发者所需要的机会窗口,也是重新点燃用户热情的一种必然选项。

大家今年都听说了“百模大战”,但跟主要在云端训练、web调用的通用大语言模型不同,高度集成化的手机,端侧算力、OS操作系统、应用并发、UI交互等一系列软硬件,都有自身的特性,也给大模型落地带来了不少限制。

把大模型装进手机,总共分几步?

结合华米OV等头部厂商的行动方略来看,我们预判,2023将是手机大模型的基建元年。

大模型落地手机,基建工程刚刚开始,后面会有更多好戏可看。具体来说,厂商必须搞定:

1.三座基建。

2.一个入口。

3.一群人。

我们就从这三个层面,来看看目前,各家的情况都怎么样?有哪些共同挑战和差异化思路? 


第一步:端侧部署,三个基建


大语言模型的参数量动辄百亿、千亿,其训练和推理过程,需要耗费大量计算资源,对于手机这样的移动智能终端来说,SoC芯片的算力是远远达不到数据中心万卡集群的规模的,怎么支撑大模型的端侧运算呢?

就算勉强带起来了,大模型占据过多的手机工作内存,抢占其他应用的资源,会不会出现卡顿或快速掉电?

本地计算不足,引入云计算又会产生很多问题,比如大模型在云上分析处理个人数据,会不会暴露我的隐私啊?

要在端侧部署,手机和大模型都要进行一番改造。

首先,模型层。

目前主要有两条路线。

一是把大模型做小,也就是在端侧引入轻量级大模型,通过量化、剪枝、蒸馏等压缩技术,调整模型结构和参数大小,以适配端侧芯片的内存和算力特点,没网也能用,以荣耀、小米为代表。

荣耀Magic6搭载的,是自研的7B端侧AI大模型(即70亿参数规模),雷军在2023年度演讲宣布“小米全面拥抱大模型”,主攻的是轻量化和本地部署,目前训练出1.3B和6B参数规模的大模型。

把大模型装进手机,总共分几步?

二是把大模型做多,提供不同参数量级的大模型,来支撑不同场景、不同任务,云端协同,以vivo、OPPO为代表。

11月vivo发布的自研AI大模型矩阵,其中包括十亿、百亿、千亿三个不同参数量级的5款大模型。其中,10亿量级模型是主要面向端侧场景打造的专业文本大模型,70亿模型是面向手机打造的端云两用模型,700亿模型是面向云端服务的主力模型。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier