复制成功

分享至

主页 > 比特币 >

深度求索发布开源代码大模型 DeepSeek Coder

2023.11.03

巴比特讯,11 月 2 日,幻方量化宣布“深度求索(DeepSeek)”在成立半年后发布第一代大模型 DeepSeek Coder,1B,7B,33B 全系列模型开源且免费商用。公告显示,DeepSeek Coder 模型有指令 Python 快速写出程序、修改 UI(用户界面)、测试 bug(程序错误)以及数据分析,学写 SQL(数据库语言)等技能。

据介绍,与之前最好的开源大模型 CodeLlama 相比,DeepSeek Coder 在代码生成任务上(使用标准数据集 HumanEval、MBPP 和 DS-1000 进行评测)分别领先 9.3%、10.8% 和 5.9%。其中 DeepSeek Coder 的 70 亿参数版本在代码能力上达到了 CodeLlama 的 340 亿参数水平。经过指令调优后的 DeepSeek Coder 模型更是全面超越了 GPT3.5-Turbo。

原文链接

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier