微软推出“从错误中学习”模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

2023.11.07

据 IT 之家 11 月 7 日消息，微软亚洲研究院联合北京大学、西安交通大学等高校提出了一项名为“从错误中学习（LeMA）”的 AI 训练方法，号称可以通过模仿人类学习知识的过程，来改进 AI 推理能力。

为了提升开源大语言模型的思维链推理能力，研究团队提出了 LeMA 方法。这种方法主要是模仿人类的学习过程，通过“从错误中学习”，以改进模型的推理能力。研究人员的方法是使用一对包含“错误解答”与“修正后正确答案”的数据来微调相关模型。为取得相关数据，研究人员收集了 5 个不同大语言模型（包括 LLaMA 及 GPT 系列）的错误答案和推理过程，再以 GPT-4 作为“订正者”，提供修正后的正确答案。

据悉，修正后的正确答案中包含三类信息，分别是原推理过程中错误片段、原推理过程出错的原因、以及如何修正原方法以获得正确答案。

原文链接

免责声明:数字资产交易涉及重大风险，本资料不应作为投资决策依据，亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考，不构成任何投资建议，用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

微软推出“从错误中学习”模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

加⼊OKEx全球社群

相关推荐