复制成功

分享至

主页 > 比特币 >

关于AI安全,OpenAI最新回应:没有人会为了尽快取得成功而“偷工减料”

2023.04.06

来源:“学术头条”(ID:SciTouTiao)

人工智能系统正在成为(人类)日常生活的一部分。关键问题是要确保这些机器与人类的意图和价值观保持一致。——Mira Murati,OpenAI CTO
关于AI安全,OpenAI最新回应:没有人会为了尽快取得成功而“偷工减料”

图片来源:由无界 AI工具生成

近些天,对 OpenAI 来说,可谓是一个“多事之秋”。

由于 ChatGPT 及 GPT-4 可能引发的安全问题,OpenAI 受到了来自外界的一些指责和阻挠:

马斯克等上千人联名呼吁 “所有人工智能实验室应立即暂停训练比 GPT-4 更强大的大模型,这一时间至少为 6 个月”;

意大利禁用 ChatGPT,OpenAl “必须在 20 天内通过其在欧洲的代表向他们通报公司执行这一要求而采取的措施”;

ChatGPT大面积封号;

ChatGPT Plus 停售;

......

这些事件表明,尽管 AI 已经证明有能力为人类社会带来诸多好处,但技术总是一把双刃剑,也会为人类社会带来带来真正的风险,AI 也不例外。

4 月 6 日,OpenAI 官方发布了一篇名为 “Our approach to AI safety” 的博客文章,探讨了如何 “安全地构建、部署和使用人工智能系统” 的方法。 学术头条在不改变原文大意的情况下,对文章做了简单的编辑。

以下为全文:

OpenAI 致力于保持强大的人工智能安全和(人类社会的)广泛受益。我们的人工智能工具为今天的人们提供了许多好处。来自世界各地的用户告诉我们,ChatGPT 有助于提高他们的生产力,增强他们的创造力,并提供量身定制的学习体验。我们也认识到,像任何技术一样,这些工具也有真正的风险——所以,我们努力确保在各个层面上将安全纳入我们的系统。


1.建立越来越安全的人工智能系统


在发布任何新系统之前,我们都会进行严格的测试,让外部专家参与反馈,努力利用人类反馈的强化学习等技术改善模型的行为,并建立广泛的安全和监测系统。

例如,在我们最新的模型 GPT-4 完成训练后,我们所有员工花了 6 个多月的时间使其在公开发布前更加安全和一致。

我们认为,强大的人工智能系统应该接受严格的安全评估。需要有监管来确保这种做法被采纳,我们积极与政府接触,探讨这种监管可能采取的最佳形式。


2.从真实世界的使用中学习,以改进保障措施


我们努力在部署前预防可预见的风险,然而,我们在实验室中能学到的东西是有限的。尽管进行了广泛的研究和测试,我们无法预测人们使用我们技术的所有有益方式,也无法预测人们滥用技术的所有方式。这就是为什么我们相信,随着时间的推移,从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的一个关键组成部分。

在有大量的保障措施下,我们谨慎地逐步发布新的人工智能系统,将其推送给一个稳步扩大的人群,并根据我们学到的经验不断改进。

我们通过我们自己的服务和 API 提供我们最有能力的模型,这样开发者就可以直接在他们的应用程序中使用这种技术。这使我们能够监测滥用情况并采取行动,并不断建立缓解措施,以应对人们滥用我们的系统的真实方式,而不仅仅是关于滥用可能是什么样子的理论。

现实世界的使用也使我们制定了越来越细微的政策,以防止那些对人们构成真正风险的行为,同时还允许我们的技术有许多有益的用途。

至关重要的是,我们相信社会必须有时间来更新和调整,以适应能力越来越强的人工智能,而且每个受这种技术影响的人都应该在人工智能的进一步发展中拥有重要的发言权。迭代部署帮助我们将各种利益相关者带入关于采用人工智能技术的对话中,比他们没有亲身经历过这些工具的情况下更有效。


3.保护儿童


关于安全的一个关键工作是保护儿童。我们要求使用我们的人工智能工具的人必须是 18 岁或以上,或 13 岁或以上并得到父母的批准,我们正在研究验证选项。

我们不允许我们的技术被用来产生仇恨、骚扰、暴力或成人内容,以及其他(有害)类别。我们的最新模型 GPT-4 与 GPT-3.5 相比,对不允许的内容请求的回应率降低了 82%,我们已经建立了一个强大的系统来监控滥用。GPT-4 现在可供 ChatGPT Plus 用户使用,我们希望随着时间的推移,能让更多人使用。

我们作出了很多努力,尽量减少我们的模型产生伤害儿童的内容的可能性。例如,当用户试图向我们的图像工具上传儿童安全虐待材料时,我们会阻止这一动作,并向国家失踪和受剥削儿童中心报告。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier