MetaMask 的存亡之秋
最佳开源模型刷新多项SOTA,首次超越Mixtral Instruct!「开源版GPT-4」家族迎来大爆发
原文来源:新智元
图片来源:由无界 AI生成
Mixtral 8x7B模型开源后,AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B,在主流基准测试中击败了Mixtral Instruct。
Mixtral 8x7B开源模型的诞生,正如Llama一样,为开源社区了带来曙光。
前段时间,Mixtral刚刚发布了8x7B模型的论文。在基准测试结果中,其性能达到或超过 Llama 2-70B和GPT-3.5。
甚至,Mixtral在数学、代码生成和多语言理解任务方面表现亮眼。
最近,一个开源研究小组Nous Research推出了新一代旗舰大模型Nous-Hermes 2 Mixtral 8x7B。
这是首个通过RLHF训练的模型,并在主流基准测试中超越Mixtral Instruct,成为最佳开源模型。
此外,Nous Research团队发布的SFT和SFT+DPO模型,以及DPO适配器将为用户提供更多选择。
在所有的基准测试中,Nous-Hermes 2 Mixtral 8x7B模型也略不逊色。
目前,这些模型同样在Hugging Face上开源上线。
最佳开源模型诞生
据介绍,最新模型是在Mixtral 8x7B MoeLLM微调训练而来。
具体来说,Nous-Hermes 2 Mixtral 8x7B是在1,000,000个条目进行了训练(主要是GPT-4生成的数据),以及整个AI领域开放数据集等其他高质量数据集。
研究人员同时还发布了SFT Only版本,以及SFT+DPO版本。
模型演示
那么,Nous Research团队最新的模型能力有多强?
编写可视化数据代码完全是小菜一碟。
它还能写赛博朋克的迷幻诗。
可以执行反向翻译,从输入文本中创建提示信息。
基准测试
与Mixtral基础模型相比,Mixtral 8x7B上的Nous-Hermes 2在以下基准测试中取得了全面提升,也是MistralAI首次击败旗舰型号Mixtral Finetune。
在GPT4All中,Nous-Hermes Mixtral 8x7B(SFT+DPO)拿下了75.7分,位列榜单第三。
在AGIEval的排行中,Nous-Hermes Mixtral 8x7B(SFT+DPO)拿下了46.05的成绩。