有了GPT-4之后,机器人把转
手机厂商扎堆布局大模型,到底是不是噱头?
原文来源:AI商业评论
图片来源:由无界AI生成
2023 年 3 月 21 日,在英伟达的年度重磅科技会议 GTC 上,英伟达 CEO 黄仁勋面向整个科技行业发出了宣告:伴随着大语言模型 ChatGPT 的火遍全球,一个新的计算平台已经被发明出来,AI 的 iPhone 时刻已经开始(The iPhone Moment of AI has started)。
由此,「AI 的 iPhone 时刻」在成为一个行业热门词汇的同时,也在无意之中预示了由大语言模型(后来又称为「大模型」)引发的这一轮 AI 变革与以 iPhone 为代表的智能手机行业的密切关联。
实际上,智能手机行业对大模型的拥抱和应用速度,快得让人目不暇接。
近一年来,包括华为、小米、OPPO、vivo、荣耀在内的中国智能手机行业参与者,都已经相继高调入局大模型——苹果虽然还没有官宣入局,但业内也有不少关于苹果布局「Apple GPT」和大模型的消息。
那么问题来了:手机厂商布局大模型,到底是不是噱头?
华为抢先一步,为什么?
大模型与智能手机首次发生应用层面的关联,其实是在 2023 年 3 月的华为春季旗舰新品发布会上。
在这次发布会上,华为常务董事、消费者业务 CEO 余承东面向用户发布了全新的「智慧搜图」功能,该功能是基于多模态大模型技术,在云端进行训练,然后在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。
简单来说,用户可以像与人对话一样,通过语音唤醒小艺,使用自然语言在手机图库中搜索出匹配如「山顶看日出、「围炉煮茶」、「蓝色珊瑚中的小丑鱼」等描述的照片。
相较于传统图库使用标签进行照片搜索,存在准确率低、响应速度慢等问题,智慧搜图更加「聪明」。结合多模态大模型,智慧搜图对亿级的图文数据进行预训练,增加了对泛化通用语义的理解,支持包含颜色、形状、物体、行为、时间和地点等多信息组合的自然语言搜索,同时还实现了端侧轻量化应用。
值得一提的是,在用户使用「智慧搜图」的过程中,相关数据均于端侧处理,进一步保护了消费者隐私安全。
那么,为什么华为能够率先利用多模态大模型技术为智能手机赋能?
答案很简单:布局很早。
实际上,早在 2021 年 4 月下旬,在 HDC.Cloud 2021 华为开发者大会上,当时担任华为云 CEO 的余承东就发布了一款重磅产品——华为云盘古大模型,它基于预训练和少量行业适配和微调的开发模式,让全球领先的 AI 真正地进入到千行百业。
具体来看,这次发布的盘古大模型,包括盘古 NLP 大模型、CV 大模型、多模态大模型和科学计算大模型。其中,盘古 NLP 大模型是业界首个千亿级生成与理解中文 NLP 大模型,盘古 CV 大模型也是业内最大的计算机视觉大模型,支持 30 亿个参数;而多模态大模型则包括跨模态搜索、扩模态生成和看图说话等功能。
所以,自 2020 年开始,华为在大模型领域已经进行了数年的布局,并且在不断进化;而到了 2023 年,随着 ChatGPT 的爆发,智能手机也成为了华为大模型能力面向端侧进行部署的一个应用场景罢了。
在 2023 年 8 月初的 HDC 2023 华为开发者大会上,余承东在讲到鸿蒙 4.0 时的升级表示,在 AI 的大模型时代,盘古大模型将助力鸿蒙生态。
具体来说,在盘古自然语言大模型、盘古视觉大模型和盘古多模态大模型的助力下,鸿蒙 4.0 系统会迎来一个全新的「小艺」,其中包括知识获取、逻辑推理、任务规划、记忆扩展、工具调用和制作辅助等方面,推动智能终端的交互变革、生产力效率变革和个性化服务变革。
需要说明的是,鸿蒙 OS 4.0 在正式发布后不久,依旧已经推送到用户手中——不仅如此,在 9 月 25 日举行的华为秋季全场景新品发布会上,根据余承东在现场公布的消息,拥有大模型加持的鸿蒙 4.0 在发布一个多月后,升级用户已经超过 6000 万。
也就是说,目前来看,在大模型面向智能手机终端的部署进程中,华为是真正的抢先者。
小米 OV 荣耀也入局,靠谱吗?
在华为之外,小米、OPPO、vivo 和荣耀等国产手机厂商,也都瞄准了大模型。