2024 年国内 AI+2C 应用发展
中国AI开源新事:扔掉旧地图,才能找到新大陆
“开源不只是为了让我们能够看到代码,它更是为了让我们能够使用代码。而后者,才是开源真正的魔力,或者说,力量所在。”
原文来源:甲子光年
作者|刘杨楠
编辑|王博
图片来源:由无界 AI生成
2023年的大模型浪潮中,“开源”是一个绕不开的关键词。大厂、明星创业公司、高校及科研院所均投身其中:
6月9日,智源研究院宣布:“悟道3.0”迈向全面开源的崭新阶段;
6月15日,百川智能推出70亿参数量的中英文预训练大模型baichuan-7B,模型免费可商用;7月,百川智能继续推出完全开源、免费可商用的baichuan-13B;
7月17日,智谱AI宣布开源大模型ChatGLM-6B和ChatGLM2-6B;
8月3日,阿里巴巴宣布开源通义千问70亿参数模型Qwen-7B;
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集;
11月6日,元象XVERSE宣布开源650亿参数高性能通用大模型XVERSE-65B;
......
为什么大模型会在国内引起新一轮AI开源热潮?
对这轮大模型初创公司而言,开源是一手“一石三鸟”的好牌——
其一,开源是一个免费的自我宣传渠道。快速迭代开源模型能及时向外界“秀肌肉”,个人开发者或企业真正使用模型后,就能直观感受到企业的技术实力;
其二,企业也能通过开源模型汇聚一批潜在的合作伙伴,甚至潜在客户,为之后的商业化做积累;
其三,“高手在民间”,企业能够通过开源汇聚一批散落各处的优秀开发者共同迭代自己的模型。
大模型给沉寂已久的AI开源填了一把火,但真正让星星之火形成燎原之势的,是一个真正能良性循环的开源生态。
在开源生态的建设中,除模型开发商外,还有一股很重要的力量——开源社区。如果说模型开发者为开源生态源源不断地注入“活水”,那么开源社区就是开源生态中的一个个“蓄水池”。
长久以来,国内开源生态的一大痛点便在于,优质“蓄水池”太少,很多源源不断的“活水”都流向了国外,最终间接导致生态难以成熟,以至于在不少人心中,都烙下了“中国做不成开源社区”的刻板印象。
今天,在“大模型把所有行业重做一遍”的全新语境下,行业或许需要重新审视中国AI开源生态的可能性。
本文,「甲子光年」深度对话始智AI wisemodel创始人兼CEO、清华校友总会AI大数据专委会副秘书长刘道全,谈谈大模型时代,中国AI开源生态的新机会。
始智AI wisemodel创始人兼CEO、清华校友总会AI大数据专委会副秘书长刘道全,图片来源:受访者提供
1.做“中国版Hugging Face”
2023年9月4日,国内首个完全独立运营的第三方AI开源社区“wisemodel.cn”上线。
“我们的目标是要打造‘中国版Hugging Face’,汇聚国内外常用的开源AI模型和数据集等资源,建设中立开放的AI开源创新平台。”Wisemodel上线当天,其背后公司始智AI的创始人刘道全在官方微信公众号写下了第一篇文章。
除始智AI创始人、CEO外,刘道全还有另一重身份——清华校友总会AI大数据专委会副秘书长。2015年,毕业三年的刘道全重返清华,开始负责清华校友AI大数据生态方面的工作。
2022年,刘道全开始筹备独立创业。
那时,ChatGPT还没有成为AI界的“屠龙少年”,新的风暴还未出现,刘道全最先瞄准了一条来钱最快,也最易把握的赛道——倒腾算力。
确定方向后,刘道全跑遍了全国各大云厂商和数据中心,基本摸清了全国的算力分布格局。但很快,他发现,算力属于基础资源类生意,“基础资源类生意最后通常都免不了价格战”,刘道全告诉「甲子光年」。
他想做点更有价值的事。事实上,当时的刘道全已经站在了“天时地利人和”的交界处。