复制成功

分享至

主页 > 数字货币 >

GPT 成熟之路官方笔记 | OpenAI 开发者日

2023.11.26

文章来源:量子位

GPT 成熟之路官方笔记 | OpenAI 开发者日

图片来源:由无界 AI 生成

ChatGPT产品打造的细节,现在OpenAI自己交了个底。

GPT 成熟之路官方笔记 | OpenAI 开发者日

并且这波干货分享真是信息量满满,包括但不限于:

ChatGPT背后的产品和研发团队如何协作 大模型应用如何从原型走向成熟 OpenAI如何优化大模型性能
…… GPT 成熟之路官方笔记 | OpenAI 开发者日

以上信息,依然来自今年的新晋“科技春晚”——OpenAI开发者日。

除了奥特曼惊艳全球的开幕演讲,当天还有更多分组讨论,视频也陆续被官方上传到了油管。

而这也算得上是OpenAI惊天抓马之前,其团队“内幕”的一次展示。

值得借鉴学习之处,我们已经整理好笔记,一起来看~


产品与研究团队合作“前所未有”


把时间拉回到2022年10月,OpenAI的研究团队和产品团队开始围绕一个idea进行讨论:为他们的基础大模型,制作一个对话界面。

彼时还处在ChatGPT的早期阶段,但研究团队和产品团队的紧密协作已然开始,它们之间相互的影响程度更是独树一帜。

或许这种团队合作模式,可以成为其他公司参考借鉴的样本。

用OpenAI模型行为产品负责人Joanne Jang的话说:

在OpenAI,研究团队和产品团队之间的相互影响, 在业内已经达到了前所未有的程度。

ChatGPT本身,就是最明显的例子。

GPT 成熟之路官方笔记 | OpenAI 开发者日

OpenAI Post-Training团队负责人Barret Zoph和Joanne共同分享了两支团队在ChatGPT开发和完善过程中的一些协作细节。

Barret团队的主要职责,是在模型能力被加入到ChatGPT和API之前,对其进行调整。具体来说,ChatGPT后期增加的联网、分析文件等功能,都是由Post-Training团队负责的。

Barret重点提到的是,正是产品团队的种种设计,让研究团队能够及时get到什么样的模型响应,对于现实世界中的用户和开发人员是真正有用的。

比如ChatGPT的点赞点踩按钮,就给研究本身带来了很多价值:

我们可以根据这样的反馈调整正在做的事情,了解哪些工作做得好,哪些做得不好,这样一来,我们就能让模型响应越来越适合用户。
在研究中,我们通常用离线评估指标和基准去衡量模型的进展,但有时候这并非人们真正使用模型的方式。产品团队的帮助,使得我们能够确保自己正走在构建通用、强大系统的方向上。
GPT 成熟之路官方笔记 | OpenAI 开发者日

而站在产品团队的角度,Joanne同样认为,OpenAI产品经理扮演的角色有独特之处:

首先,在OpenAI做产品的目标不是收入、参与度、增长等传统产品指标,而是打造造福全人类的通用人工智能。

其次,OpenAI的产品经理往往是从技术而非用户问题的角度出发,去设计产品功能的。

最后,OpenAI研究团队和产品团队相互影响的程度非常之高,在业内可以说达到了前所未有的程度。

GPT 成熟之路官方笔记 | OpenAI 开发者日

还是以ChatGPT诞生的过程为例。从GPT-3,到InstructGPT,再到ChatGPT,研究团队发现,直接在多轮对话上训练模型,能让教导模型新的行为这件事变得更加有效。

而具体教导(设计)模型行为的工作,就是靠产品团队来参与完成的:比如说,当用户告诉ChatGPT“你现在是一只猫”,ChatGPT应该表现出怎样的默认行为?

产品团队对此进行了大量的实验,以找出适合大多数用户的默认模式。

(p.s. 不过Joanne也提到,对于用户而言,最好的模型是个性化的模型,这也是他们对未来大模型发展方向的预判之一。)


非线性策略优化大模型性能


讲完协同“内幕”,再来看技术细节。

在开发者日上,OpenAI的技术人员分享了GPT-4中使用的大模型优化技术。

划重点就是,采用非线性策略,具体包括两个维度和四个象限。

OpenAI提出了一个多层次的非线性优化框架,涉及到了提示工程、搜索增强生成(RAG)和微调这三种技术。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier