复制成功

分享至

主页 > 比特币 >

“你的AI侵犯了我的版权”:浅谈AIGC背后的版权保护问题

2023.03.02

作者:朱开鑫,腾讯研究院高级研究员;张艺群,腾讯研究院助理研究员。


“你的AI侵犯了我的版权”:浅谈AIGC背后的版权保护问题

图片来源:由无界版图AI工具生成

ChatGPT的大火,带来了AIGC技术及相关应用的“强势出圈”。除了感慨AI超强的内容生成输出能力之外,各界也开始思考AIGC可能产生的潜在风险。2023年1月23日,美国三名漫画艺术家针对包括Stability AI在内的三家AIGC商业应用公司,在加州北区法院发起集体诉讼,指控Stability AI研发的Stable Diffusion模型以及三名被告各自推出的、基于上述模型开发的付费AI图像生成工具构成版权侵权。

无独有偶,2月15日《华尔街日报》记者弗朗西斯科·马可尼(Francesco Marconi)也公开指责,Open AI公司未经授权大量使用路透社、纽约时报、卫报、BBC等国外主流媒体的文章训练Chat GPT模型,但从未支付任何费用。[1]

AIGC技术开发与应用中的知识产权尤其是版权侵权问题之所以受到高度关注,其根源在于AIGC模型的形成和完善依赖于大量的数据训练,而用于训练的数据往往包含受版权法保护的内容。

AIGC是如何利用版权作品进行数据训练与输出成果的?这一过程存在哪些版权侵权风险?应当如何有效应对AIGC版权利用带来的侵权风险?本文以“Stable Diffusion案”为引,结合AIGC内容生产模式的技术原理,对上述问题进行探讨。

“你的AI侵犯了我的版权”:浅谈AIGC背后的版权保护问题

(左图:画家Erin Hanson在2021年创作的作品;右图:在Stable Diffusion中以“style of Erin Hanson”等作为提示生成的结果)[2]


全球首例:“Stable Diffusion”AIGC模型版权侵权案


作为全球首例知名的AIGC商业化应用领域,算法模型及训练数据版权侵权案,“Stable Diffusion案”自起诉书公布伊始便引起了各界关注与探讨,其最终判决结果亦将对AIGC产业和技术发展产生举足轻重的影响。回归到案件本身,我们发现:其一,从核心争议来看,当前国内外对于AIGC获取与利用版权作品进行算法训练是否合法存在诸多争议,尚无立法和司法层面的明确共识;其二,从涉案技术原理而言,Stable Diffusion模型训练过程中利用版权作品的方式、利用行为的版权定性仍有待分析明确。

在本案中,原告围绕Stability AI公司未经权利人许可,获取与利用其版权作品作为Stable Diffusion的“训练图像”展开指控。原告将Stable Diffusion模型定性为“一个复杂的拼贴工具”(a complex collage tool)——“将无数受版权保护的图像存储和合并为训练图像后……生成完全基于训练图像的‘新’图像”。被告“从使用受版权保护的图像中获得商业利益和丰厚利润”,而数百万权利人则因生成的“新”图像对原作品交易市场的挤占而遭受损失。[3]


技术原理:AIGC模型涉及哪些作品利用行为?


表面看,不同AIGC模型生成的内容形式各异,涵盖文字、图像、语音、视频等。但各类AIGC模型利用现有作品进行模型训练、生成最终结果的方式却存在异曲同工之处:将数据库中的作品数据进行一定程度的形式转换后输入AIGC模型,利用AIGC模型自主学习能力从中提取有价值的内容,再根据输入的指令生成与之相匹配的学习结果加以输出。以此次陷入纠纷的Stable Diffusion模型为例,其以包含数以亿计的图像数据库——LAION-5B[4]作为训练数据来源,原告主张的被侵权作品亦包含于内。

简单来讲,Stable Diffusion模型对版权作品的利用存在于两个阶段。第一,AI模型训练阶段。Stable Diffusion利用版权作品训练内部组件“图像编码器”(U-Net模型),辅之以“Clip文本编码器”(Text Encoder模型),最终做到只需输入一段描述性文字,即可生成对应的图像内容。第二,AI模型应用阶段。Stable Diffusion经过充分训练后,可以依据用户给出的文本输出最终图像。但这些生成的图像内容,很大的概率包含并展现出作为训练数据的版权作品的元素及特征。

“你的AI侵犯了我的版权”:浅谈AIGC背后的版权保护问题

(Stable Diffusion内部结构图)[5]


AIGC模型训练阶段存在哪些版权侵权风险?


在模型训练阶段,Stable Diffusion会将版权作品和与之对应的文本数据转换为同一个“图像信息空间”(latent space)的“潜在表现形式”(Latent Representations)。具言之,Stable Diffusion模型以从数据库中下载的作品作为输入对象,对其添加噪点并进行编码(压缩),使作品进入“图像信息空间”。进入这个空间的版权作品,会与被“Clip文本编码器”编码的描述性文本进行“交互”,得到两者信息融合的结果——“潜在表现形式”。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier