看完4个国产大模型的用户协议，我整个人都不好了

2023.05.18

来源：娱乐资本论，作者：付梦珍，编辑：James

前几天，有人发现讯飞的“星火认知大模型”官方体验平台SparkDesk在用户协议中有一条令人不解的规定：

根据娱乐资本论的查询，SparkDesk 的用户体验规则中确实有相关含义的条文。就此，我们一同查询了国内几款已经公测的大模型产品的用户协议、测试规则和隐私条款，发现诸如“用户生成内容属于平台”、“注销大模型服务会同时注销其它服务”、“平台可以收集在公开渠道、社交网络上发现的你的个人信息”等不尽合理的规定还有很多。

所以，我们想在本文中告诉你：

哪些你认为完全合理的AI大模型使用方法，其实是“违反用户协议”的？

你对大模型输入的隐私或机密信息，会被怎样处理？

当你有可能违反了AI大模型的使用条款时，这意味着什么？

一不小心，就违反协议了

3月中旬，百度文心一言开放产品测试，4月7日阿里的“通义千问”启动内测，4月17日昆仑万维“天工”启动内测，4月24日科大讯飞“星火认知大模型”启动内测。

它们都为用户提供了一个相对非常简短的“测试规则”来代替以往冗长的用户协议，例如《文心一言测试规则》，相对的用户也必须完全阅读并同意后才能使用。

一般来说，这些测试规则只讲了三件事：

1.请不要发布违法违规的内容；

2.我们还很不成熟，会有错误，请不要拿生成结果直接用于严肃的场合；

3.请尽量多给我们提供反馈。

然而，讯飞的SparkDesk额外规定了你不能把它生成的东西，甚至包括它的界面，以任何形式公开出去。也就是说，当你在微信群里跟人截图炫耀自己获得内测资格的一瞬间，你已经违反了他们的条款。娱乐资本论在《SparkDesk用户体验规则》中找到了对应的规定原文：

鉴于SparkDesk服务目前处于体验阶段，SparkDesk的有关计算机程序、代码、技术数据、系统及应用软件、数据库、算法、交互界面（包含输入和输出内容）、产品设计、产品发布与规划信息等技术信息或商业信息属于保密信息。

您知悉并同意，对前述保密信息严格保密！未经允许，您不得将前述保密信息以任何形式（包括截图、打印、软盘、光盘、硬盘、电子邮件、网络、无线通讯等手段）披露、使用或允许他人使用，或者发送至网站、微博、微信群组或朋友圈、自媒体账号等网络环境中。

若您违反本规则约定的保密义务，我们有权依法追究您的法律责任。

很显然，“交互界面（包含输入和输出内容）”涵盖了我们在使用SparkDesk时，对着它的对话框输入的内容，以及它返回给我们的结果。而往往我们都会用微信截图发给群里的朋友，这是再自然不过的举动了。

而且输入SparkDesk的名字，你就能发现有不少公众号作者，先是在注册时看到了这段禁止截图的话，点完同意以后马上开始截图体验，即使水印带着他的手机号也毫不畏惧。
我们很好奇，这种制定时就应该预见到不可能执行的规定，到底是怎么被放上去的。

我能把自己的小秘密告诉大模型吗？

除了抓取公网信息外，大模型也会保留用户与它的聊天数据用作训练，因此用户的个人信息或企业的商业秘密也有暴露在公众面前的风险。此前，三星电子的半导体部门发生了3起将商业机密输入ChatGPT的事件。

ChatGPT也曾泄露部分ChatGPT Plus订阅者的个人信息，这违反了欧盟的GDPR隐私条款规定。
那么，国产大模型会在协议中说明它们收集用户的哪些信息呢？

与ChatGPT等相同，国产AI大模型都会收集用户与模型的问答历史。如果你对某个回答点了旁边的“赞”或“踩”，这些进一步的反馈信息也在被收集的信息之列。

这种问答数据的收集主要用于优化产品。不过百度文心一言规定，这些信息还可以被百度方面用作商业用途。
《文心一言（测试版）个人信息保护规则》提到：

我们通过技术手段对个人信息进行去标识化处理后，去标识化处理的信息将无法识别主体。请您了解并同意，在此情况下我们有权使用已经去标识化的信息；在不透露您个人信息的前提下，我们有权对参与测试人员数据库进行分析并予以商业化的利用。

当我们展示您的个人信息时，我们会采用包括内容替换、匿名处理方式对您的信息进行脱敏展示，以保护您的信息安全。

看完4个国产大模型的用户协议，我整个人都不好了

加⼊OKEx全球社群

相关推荐