复制成功

分享至

主页 > 比特币 >

上海人工智能实验室许韶华:评测对于 AI 大模型后续研发非常重要

2023.10.21

据上证报中国证券网讯报道,在 10 月 21 日举行的第四届 1024 资管科技开发者大会(ITDC 2023)资产管理垂直领域大模型开发与应用论坛上,上海人工智能实验室书生大模型生态和产业合作负责人许韶华分享了大语言模型技术总览,即数据准备、预训练、指令微调、部署 & 推理、模型评测。

许韶华表示,大规模构建高质量语料数据是大模型研发中非常具有挑战的环节,其中精细化数据处理是关键,而掌握领域数据是建设行业大模型的关键。算力方面,语言大模型的预训练计算量巨大,需要在大规模计算集群上进行,并且依赖高效的训练系统以充分发挥集群算力。在技术层面,实现大模型的高效且稳定的训练也是非常具有挑战性的。

许韶华认为:“评测主要目的不是为了排名,而是指路,对于我们认识模型能力,安排后续研发非常重要。”

原文链接

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier