复制成功

分享至

主页 > 比特币 >

狂飙的春天:国产AI大模型扎根涌现的两个月,给我们带来了什么?

2023.04.27

来源:澎湃新闻

记者 邵文 方晓

·从2023年2月20日“国内第一个对话式大型语言模型”MOSS发布,到4月21日该模型正式开源,两个月间,多家中国企业和研究机构以加速度扎堆冲入被ChatGPT轰炸出来的AI大模型赛道。在梳理这些大模型所试图呈现的特点之后,我们该如何看待这种趋势?

·如何判断各家大模型的水平?“通常需要使用测试数据集来评估大模型性能,也可以根据模型中的参数数量来判断模型的复杂度。模型的响应时间也是一个重要的衡量因素,最主要的还是在线上环境实际应用时,通过监测模型在生产环境中的表现来判断其水平。”

狂飙的春天:国产AI大模型扎根涌现的两个月,给我们带来了什么?

图片来源:由无界 AI工具生成

ChatGPT的发布就像打开了“潘多拉的盒子”,在中国引发了一场你追我赶的“狂飙”。

2023年2月20日深夜,MOSS的官网因服务器流量过载瘫痪,这是中国人对ChatGPT类产品兴趣暴增的最初征兆之一。

此MOSS不是《流浪地球》系列电影里的机器人,而是复旦大学邱锡鹏教授团队发布的“国内第一个对话式大型语言模型”。两个月后的4月21日,MOSS正式开源,成为国内首个插件增强的开源对话语言模型。

这两个月,注定会成为中国科技与商业界被铭记的两个月。一切都按下了快进键,时间仿佛被压缩,中国企业和研究机构以加速度扎堆冲入这个被ChatGPT轰炸出来的新赛道。

据澎湃科技(www.thepaper.cn)不完全统计,目前国内已发布的所谓AI大模型已超过20个,除了百度、阿里等大厂,创新工场董事长李开复、百川智能CEO王小川、出门问问CEO李志飞等纷纷宣示入局。各类大模型名字五花八门,有竭力体现中国文化深厚内涵的,也有从国际知名数学家的理论中引经据典的。

回顾这狂飙突进的两个月,澎湃科技梳理了一些主要国产大模型所试图呈现的特点。除此之外,两个至关重要的问题也被提出:我们该如何判断这些大模型?喧嚣之下应该有怎样的冷静思考?

狂飙的春天:国产AI大模型扎根涌现的两个月,给我们带来了什么?


从MOSS开始:为什么要坚持做开源?


“我们的计算资源不足以支持如此大的访问量,并且作为学术团队我们也没有相关的工程经验,给大家造成非常不好的体验和第一印象,在此向大家致以真诚的歉意。”2月21日,在MOSS官网被“挤瘫”后,其开发团队发布声明诚恳致歉,并表示,“中国版ChatGPT的诞生还需要中国全体AI从业者的努力,也更需要不断和人交互以提高能力。”

这种谦虚、低调、怀着“继续学习”态度的回应,成为此后多个国产大模型设定叙事基调的先例。

根据邱锡鹏团队的介绍,MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。

这款模型引发关注的一个点是,它的英文回答水平比中文高,开发团队解释称,“因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”

粤港澳大湾区数字经济研究院(IDEA)认知计算与自然语言中心文本生成算法团队负责人王昊对澎湃科技表示,“相较于英文数据,中文数据的开源程度较低,导致中文数据集的规模相对较小。此外,英文作为科研主流语言,在学术界和工业界中得到广泛应用,积累了大量高质量的语料数据,这为英文自然语言处理的研究提供了极大的优势。”

MOSS的横空出世,令复旦大学邱锡鹏团队一举成名。在多个公开场合,邱锡鹏对大型语言模型的研究与发展做出了详细阐释。

4月1日,邱锡鹏在一个论坛上介绍,整体而言,MOSS基于公开的中英文数据训练,目前已经拥有200亿参数,具有和人类对话的能力,并可以通过与人类交互实现迭代优化。与此同时,他也坦承,尽管对语言的理解能力和ChatGPT已经非常相近,但是目前MOSS的整体完成度并不高,主要原因在于MOSS在部署和训练上投入的资本还非常有限,相较于千亿级的ChatGPT,大概只是其规模的十分之一,所以MOSS还有很多事实类知识记不住,思维链能力也相对较差。目前团队也在积极尝试引入一些外部工具,来进一步扩大模型参数规模,不断改进与优化。

在上述论坛的圆桌讨论中,邱锡鹏谈到了为什么MOSS要开源。“MOSS还是想以开源的形式去做,为什么美国卡我们脖子,一卡一个准,就是我们的生态没有建好。OpenAI做ChatGPT的时候,它不需要分心做其他东西,只是把模型做好。微软帮它做算力,还有一家开源公司帮它做部署,也有专门的公司来进行数据清洗。它是在整个生态中去做的,生态促使它发展非常快。”他说,“而我们国内每家公司都要做,这就会产生一个问题,每家都做不大,每个都做自己的,所有的东西都自己来,又不愿意跟别人分享。每家数据、算力有限,也没有多少钱可以支持研发,又在做一些很基础、重复性的事情。”

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier