复制成功

分享至

主页 > 比特币 >

看完4个国产大模型的用户协议,我整个人都不好了

2023.05.18

来源:娱乐资本论,作者:付梦珍,编辑:James

前几天,有人发现讯飞的“星火认知大模型”官方体验平台SparkDesk在用户协议中有一条令人不解的规定:

看完4个国产大模型的用户协议,我整个人都不好了

根据娱乐资本论的查询,SparkDesk 的用户体验规则中确实有相关含义的条文。就此,我们一同查询了国内几款已经公测的大模型产品的用户协议、测试规则和隐私条款,发现诸如“用户生成内容属于平台”、“注销大模型服务会同时注销其它服务”、“平台可以收集在公开渠道、社交网络上发现的你的个人信息”等不尽合理的规定还有很多。

所以,我们想在本文中告诉你:

哪些你认为完全合理的AI大模型使用方法,其实是“违反用户协议”的?

你对大模型输入的隐私或机密信息,会被怎样处理?

当你有可能违反了AI大模型的使用条款时,这意味着什么?


一不小心,就违反协议了


3月中旬,百度文心一言开放产品测试,4月7日阿里的“通义千问”启动内测,4月17日昆仑万维“天工”启动内测,4月24日科大讯飞“星火认知大模型”启动内测。

它们都为用户提供了一个相对非常简短的“测试规则”来代替以往冗长的用户协议,例如《文心一言测试规则》,相对的用户也必须完全阅读并同意后才能使用。

一般来说,这些测试规则只讲了三件事:

1.请不要发布违法违规的内容;

2.我们还很不成熟,会有错误,请不要拿生成结果直接用于严肃的场合;

3.请尽量多给我们提供反馈。

然而,讯飞的SparkDesk额外规定了你不能把它生成的东西,甚至包括它的界面,以任何形式公开出去。也就是说,当你在微信群里跟人截图炫耀自己获得内测资格的一瞬间,你已经违反了他们的条款。娱乐资本论在《SparkDesk用户体验规则》中找到了对应的规定原文:

鉴于SparkDesk服务目前处于体验阶段,SparkDesk的有关计算机程序、代码、技术数据、系统及应用软件、数据库、算法、交互界面(包含输入和输出内容)、产品设计、产品发布与规划信息等技术信息或商业信息属于保密信息。

您知悉并同意,对前述保密信息严格保密!未经允许,您不得将前述保密信息以任何形式(包括截图、打印、软盘、光盘、硬盘、电子邮件、网络、无线通讯等手段)披露、使用或允许他人使用,或者发送至网站、微博、微信群组或朋友圈、自媒体账号等网络环境中。

若您违反本规则约定的保密义务,我们有权依法追究您的法律责任。

很显然,“交互界面(包含输入和输出内容)”涵盖了我们在使用SparkDesk时,对着它的对话框输入的内容,以及它返回给我们的结果。而往往我们都会用微信截图发给群里的朋友,这是再自然不过的举动了。

而且输入SparkDesk的名字,你就能发现有不少公众号作者,先是在注册时看到了这段禁止截图的话,点完同意以后马上开始截图体验,即使水印带着他的手机号也毫不畏惧。
我们很好奇,这种制定时就应该预见到不可能执行的规定,到底是怎么被放上去的。


我能把自己的小秘密告诉大模型吗?


除了抓取公网信息外,大模型也会保留用户与它的聊天数据用作训练,因此用户的个人信息或企业的商业秘密也有暴露在公众面前的风险。此前,三星电子的半导体部门发生了3起将商业机密输入ChatGPT的事件。

ChatGPT也曾泄露部分ChatGPT Plus订阅者的个人信息,这违反了欧盟的GDPR隐私条款规定。
那么,国产大模型会在协议中说明它们收集用户的哪些信息呢?

与ChatGPT等相同,国产AI大模型都会收集用户与模型的问答历史。如果你对某个回答点了旁边的“赞”或“踩”,这些进一步的反馈信息也在被收集的信息之列。

这种问答数据的收集主要用于优化产品。不过百度文心一言规定,这些信息还可以被百度方面用作商业用途。
《文心一言(测试版)个人信息保护规则》提到:

我们通过技术手段对个人信息进行去标识化处理后,去标识化处理的信息将无法识别主体。请您了解并同意,在此情况下我们有权使用已经去标识化的信息;在不透露您个人信息的前提下,我们有权对参与测试人员数据库进行分析并予以商业化的利用。

当我们展示您的个人信息时,我们会采用包括内容替换、匿名处理方式对您的信息进行脱敏展示,以保护您的信息安全。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier