复制成功

分享至

主页 > 比特币 >

小米大模型,不搞“ChatGPT”

2023.06.12

来源:深燃,作者:金玙璠、贺树龙,编辑:贺树龙

小米大模型,不搞“ChatGPT”

图片来源:由无界 AI工具生成

ChatGPT上线半年后,一场大模型追逐战继续在太平洋两岸上演。

由OpenAI、微软和英伟达组成的联盟,正在太平洋东岸玩命狂奔。今年3月以来,中国科技公司紧急跟进,百度、阿里、商汤、科大讯飞相继推出“类ChatGPT”产品,腾讯、华为、京东公开表示正在跟进大模型,都想抓住这个比互联网时代还“大十倍”的机会。

“百模大战”当前,作为国内大型科技企业的小米,却显得格外冷静。

小米掌门人雷军说,小米正在研发一些技术和产品,等打磨好了再给大家演示。小米集团总裁卢伟冰称,小米目前拥有超过1200人的AI团队,会积极拥抱大模型,与业务深度结合,但不会像OpenAI一样去做通用大模型。

这些信息都加深了外界的疑问:小米会加入“百模大战”吗?

小米集团AI实验室主任王斌博士告诉深燃,小米自己会去自研通用大模型,但不会单独发布一款类ChatGPT产品,“也不会发布一个PPT,或者演示几个例子,就说我们有大模型了”,而是自研大模型最终会由产品带出来。

这是继小米官宣大模型团队后,首度对外披露大模型的路线和进展。今年4月14日,小米宣布大模型团队由栾剑带队,向王斌汇报。王斌曾在中科院从事了20多年NLP(自然语言处理)相关的研究和开发工作,2018年加入小米,2019年起负责AI实验室。AI实验室是小米AI战略的核心部门。

曾经做过对话大模型的小米,在通用预训练语言大模型上,是少有的理智派。王斌透露,目前专职大模型团队30多人,不会马上极速扩张;这个团队的目标还是通用语言大模型,第一步的目标基座模型参数在几百亿,然后会视前期爬坡结果,再决定下一步投入。

“从研发出大模型到落地还有很长的一段距离,是否能找到合适的重要场景是很多大模型公司的痛点。”在王斌看来,小米的优势是有足够多的现成的大模型落地场景,包括小爱同学、loT、自动驾驶、机器人等等,丰富的应用场景也能够反哺大模型的能力。

小米不缺场景,但要训练出大模型,数据、算力、人才的积累缺一不可。王斌说,小米在人才上有一定储备,算力和数据量方面的挑战较大。一方面,算力需要克服系统级的挑战,且要做到训练成本可控;另一方面,高质量数据的获得、清洗,都要花费不少时间和成本。

在新一轮AI大模型浪潮中,小米AI团队为什么不发布“类ChatGPT产品”?小米是怎么判断大模型的技术路线、技术难度的?日前,深燃总编辑贺树龙和小米技术委员会AI实验室主任王斌进行了一场对话。以下是核心内容:


小米大模型:团队30人,不发“类ChatGPT”


深燃:4月14日,小米任命栾剑为大模型团队负责人,向你汇报。能否介绍下小米大模型团队是怎么诞生的?

王斌:大模型团队是4月份宣布的,但在这之前已经开始运作。

去年11月30日,OpenAI发布ChatGPT后,我们一堆人快速注册账号,在上面开始玩。ChatGPT确实很颠覆,我们做了这么多年AI,它的很多能力超出了我们研发人员的预期。

很快,我们就组织了多个内部大模型交流群,讨论大模型的技术,以及它对机器翻译、人机对话、智能问答、客服会产生哪些颠覆性的影响。早期参加研讨的很多人,后来都成了专职大模型团队的重要成员。

深燃:小米大模型团队会不会来得有点晚?

王斌:对于大模型,我们属于理智派。

在ChatGPT诞生之前,小米内部做过大模型相关的研发和应用,主要是预训练+下游任务监督微调的方式来做人机对话,模型的参数在几十亿级别。当然,这类模型并非现在所说的通用大模型。

我们非常清楚,通用大模型的研发和应用是一个长期的工作,不是早晚的问题。我们是按照自己的时间规划和步骤在走,当时觉得时间点到了,就做了团队发布。

深燃:大模型团队有多少人?有继续扩张的计划吗?

王斌:主力团队目前有30多人。我们目前是先按照人才、数据、模型、算力、评测、产品这几个方面去筹备,等到了一定阶段再逐步调整或扩张。

我们目前不会马上扩大人数,比如一下招到100人。因为在积累能力爬坡阶段,可能招这么多人都不知道怎么安排,反而是一种浪费。

随着大模型相关信息的不断公开,资本和人才的不断涌入,大模型领域的发展非常快,大家的看法变化也很大。前不久ChatGPT刚出来时,大家觉得,实现类似的大模型基本不可能,但是慢慢地,很多人觉得可能性很大,还有一些人认为,不需要那么大规模的模型就可以满足很多产品的需求。大家的投资力度,差异也特别大。有些人可能觉得团队至少要几百人,有些人认为不需要。

深燃:接下来有没有一些阶段性的规划,什么时候对内测试和对外发布?

王斌:跟其他公司不太一样,小米天生带着产品的属性,我相信小米大模型出来的时候,是由产品带着出来。

我们内部有可能会在Q3之前测试。不过,这也不是一个必然的节点。

深燃:也就是说,小米不会发布一个类ChatGPT产品?

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier