全球最强开源大模型一夜易主！谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

2024.02.22

文章来源：新智元

图片来源：由无界AI生成

一声炸雷深夜炸响，谷歌居然也开源LLM了？！

这次，重磅开源的Gemma有2B和7B两种规模，并且采用了与Gemini相同的研究和技术构建。

有了Gemini同源技术的加持，Gemma不仅在相同的规模下实现SOTA的性能。

而且更令人印象深刻的是，还能在关键基准上越级碾压更大的模型，比如Llama 2 13B。

与此同时，谷歌还放出了16页的技术报告。

技术报告地址：https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

谷歌表示，Gemma这个名字源自拉丁语「gemma」，也就是「宝石」的意思，似乎是在象征着它的珍贵性。

历史上，Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode，都是谷歌为开源社区贡献的创新。

谷歌：今天我就来给你表演一个什么是Open AI

而谷歌今天在全球范围内同步推出的Gemma，必然会再一次掀起构建开源AI的热潮。

同时也坐实了OpenAI「唯一ClosedAI」的名头。

OpenAI最近刚因为Sora火到爆，Llame据称也要有大动作，谷歌这就又抢先一步。硅谷大厂，已经卷翻天了！

谷歌：开源闭源我全都要

Hugging Face CEO也跟帖祝贺。

还贴出了Gemma登上Hugging Face热榜的截图。

Keras作者François Chollet直言：最强开源大模型，今日易主了。

有网友已经亲自试用过，表示Gemma 7B真是速度飞快。

谷歌简直是用Gemini拳打GPT-4，用Gemma脚踢Llama 2！

网友们也是看热闹不嫌事大，召唤Mistral AI和OpenAI今晚赶快来点大动作，别让谷歌真的抢了头条。（手动狗头）

同规模刷新SOTA，越级单挑Llama 2 13B

可以看到，Gemma-7B模型在涵盖一般语言理解、推理、数学和编码的8项基准测试中，性能已经超越了Llama 2 7B和13B！

并且，它也超越了Mistral 7B模型的性能，尤其是在数学、科学和编码相关任务中。

在安全性方面，经过指令微调的Gemma-2B IT和 Gemma-7B IT模型，在人类偏好评估中都超过了Mistal-7B v0.2模型。

特别是Gemma-7B IT模型，它在理解和执行具体指令方面，表现得更加出色。

一整套工具：跨框架、工具和硬件进行优化

这次，除了模型本身，谷歌还提供了一套工具帮助开发者，确保Gemma模型负责任的使用，帮助开发者用Gemma构建更安全的AI应用程序。

- 谷歌为JAX、PyTorch和TensorFlow提供了完整的工具链，支持模型推理和监督式微调（SFT），并且完全兼容最新的Keras 3.0。

- 通过预置的Colab和Kaggle notebooks，以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成，用户可以轻松开始探索Gemma。

- Gemma模型既可以在个人笔记本电脑和工作站上运行，也可以在Google Cloud上部署，支持在Vertex AI和Google Kubernetes Engine (GKE) 上的简易部署。

- 谷歌还对Gemma进行了跨平台优化，确保了它在NVIDIA GPU和Google Cloud TPU等多种AI硬件上的卓越性能。

相关推荐