迪士尼的“元宇宙梦”醒
前沿对话:中国AIGC新机遇,如何掘金大模型和应用双赛道
3月29日消息,首届中国AIGC产业峰会在京举行,大会由量子位主办,聚集起了领域内产学研代表,分享和探讨了包括大模型、生成式AI、ChatGPT等在内时下热议趋势和话题。
在题为《中国AIGC新机遇》的圆桌对话环节,量子位主编金磊与4位从业者展开了精彩的探讨。他们是:
元语智能联合创始人兼COO朱雷;
峰瑞资本投资合伙人陈石;
无界AI联合创始人马千里;
华院数智人商业化副总裁林莱尼。
图片来源:圆桌环节
以下为圆桌内容,经巴比特整理,有删减。
金磊:我们每个话题都设置了一个关键词,第一个关键词叫“感受”,在这波AIGC热潮中,您最直观的感受是什么?
朱雷:
震撼和冲击。比如,ChatGPT在各行各业接受程度和应用深度,远远超过了我们的预期。原来对AI的关注群体都在小圈子里,AI也仅仅是在某些环节里应用,这次它破圈了,这是一个非常大的技术变革。
陈石:
经历了几次AI的技术变革,但这次还是让我们感到惊讶,突然一个跳跃,不是连续的变化。它已经具备了通用人工智能的火花,而且还在不停燃烧,所以也很惊喜。
从产业角度来说,它一定对整个人类社会的效率、体验,都会是一个非常大的提升,很本质地改变各行各业,特别是内容行业、教育行业、科研等等。
所以,我们很兴奋,这是人类的福祉,前提是你不要背叛人类。另外,我觉得也是创业者很好的机会。
马千里:
站在创业者的角度看会更加焦虑,因为发展速度太快了。你做了大量工作,但是有可能在大模型底部的创新,或者是别的团队的创新,他们很快就能赶上来,有时候会有技术的焦虑感。
另一方面,其实是所有行业内的人都在焦虑,甚至传统产业的一些人也在焦虑,因为他们焦虑他们会找到我们,抱团取暖。比如奇瑞汽车、上汽集团,有做潮玩的,做快消品的等等,他们都会找到我们,他们会把他们的设计需求,把他们的一些诉求提给我们,甚至会把他们自己的图片给到我们,我们一块去做训练。他们担心的是说如果他们不参与到这个浪潮里就会被淘汰掉。
所以,虽然有焦虑,但更多是在焦虑中有前进的感觉。
金磊:我们的第二个关键词叫做模型同质化和创新性。就目前来看,无论是AIGC应用的玩法,或者是背后算法模型似乎有同质化的趋势。您觉得中国AIGC的原创性该如何体现?
朱雷:
目前来讲,在基础研究或者原创性上国内与国外是有一段距离。但是不是说我们目前做自研的大模型没有价值?我觉得反而势在必行。
第一点,我们国内都在做中文语料的大规模梳理,中文数据集,中文的通用语料质量相对来说会差一些,开源氛围也差一些,比如医疗这个行业,国外有很多开源数据集,国内我们了解到只有两个,一个是杭州这边有家医院,一个是自贡市有数据集。我们要做这个事情,就要推动开源数据集以及开源模型的一个氛围和一个生态构建。
第二点,现在大模型的AI基础设施在国内已经达到了相当高的重要程度的量级,这个时候对人才的吸引力很高,从长期角度来看,这个事情的意义对于国内做基础设施的,长远上来讲是非常有价值的。
说到国内的这些模型的同质化和创新性,对于国内初创公司来讲,创新性是要体现在你要对于这个行业有足够多的理解,以及迅速地在行业内把数据和场景跑起来。对初创公司来说,你可以在模型底层数据层面上和指令微调层面上做一定的创新性。
马千里:
做产品创新来说拥抱SD(国外开源文生图模型stable diffusion)生态没有太多的关系,因为大量数据训练其实还是要自己去做。你如果想做出差异化,这是自然一种选择。
现在开发国风模型(国风风格的文生图),我们会有大量国风类图片数据,比如像中国人的脸、外貌,比如汉服,需要很具体、很精细区分不同时代、名族服饰样式,你的左衣襟和右衣襟之间都会是有区别的,做国风类图片的这些人他很要求这些东西。
这是一方面,最重要创新在于,中国的用户数据是非常重要的。我们无界AI平台A有200万用户,每天创作接近3000万张图片。这些内容被大量用户的收藏,使用一键同款制作,等等,这么多用户的行为给你反馈。我们会把这些受到喜欢的作品的关键词,拿来做进一步模型训练,使得我们平台能力得到增强,得到创新,这也使得虽然基于开源SD,但是我平台的作品质量会和市面上大部分产品不太一样,因为我们有自己的数据循环在里面,这是一个创新点。
林莱尼: