Smart Layer即将空投,200万枚
全球最强开源大模型一夜易主!谷歌Gemma 7B碾压Llama 2 13B,今夜重燃开源之战
文章来源:新智元
图片来源:由无界AI生成一声炸雷深夜炸响,谷歌居然也开源LLM了?!
这次,重磅开源的Gemma有2B和7B两种规模,并且采用了与Gemini相同的研究和技术构建。
有了Gemini同源技术的加持,Gemma不仅在相同的规模下实现SOTA的性能。
而且更令人印象深刻的是,还能在关键基准上越级碾压更大的模型,比如Llama 2 13B。
与此同时,谷歌还放出了16页的技术报告。
技术报告地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf
谷歌表示,Gemma这个名字源自拉丁语「gemma」,也就是「宝石」的意思,似乎是在象征着它的珍贵性。
历史上,Transformers、TensorFlow、BERT、T5、JAX、AlphaFold和AlphaCode,都是谷歌为开源社区贡献的创新。
谷歌:今天我就来给你表演一个什么是Open AI
而谷歌今天在全球范围内同步推出的Gemma,必然会再一次掀起构建开源AI的热潮。
同时也坐实了OpenAI「唯一ClosedAI」的名头。
OpenAI最近刚因为Sora火到爆,Llame据称也要有大动作,谷歌这就又抢先一步。硅谷大厂,已经卷翻天了!
谷歌:开源闭源我全都要
Hugging Face CEO也跟帖祝贺。
还贴出了Gemma登上Hugging Face热榜的截图。
Keras作者François Chollet直言:最强开源大模型,今日易主了。
有网友已经亲自试用过,表示Gemma 7B真是速度飞快。
谷歌简直是用Gemini拳打GPT-4,用Gemma脚踢Llama 2!
网友们也是看热闹不嫌事大,召唤Mistral AI和OpenAI今晚赶快来点大动作,别让谷歌真的抢了头条。(手动狗头)
同规模刷新SOTA,越级单挑Llama 2 13B
可以看到,Gemma-7B模型在涵盖一般语言理解、推理、数学和编码的8项基准测试中,性能已经超越了Llama 2 7B和13B!
并且,它也超越了Mistral 7B模型的性能,尤其是在数学、科学和编码相关任务中。
在安全性方面,经过指令微调的Gemma-2B IT和 Gemma-7B IT模型,在人类偏好评估中都超过了Mistal-7B v0.2模型。
特别是Gemma-7B IT模型,它在理解和执行具体指令方面,表现得更加出色。
一整套工具:跨框架、工具和硬件进行优化
这次,除了模型本身,谷歌还提供了一套工具帮助开发者,确保Gemma模型负责任的使用,帮助开发者用Gemma构建更安全的AI应用程序。
- 谷歌为JAX、PyTorch和TensorFlow提供了完整的工具链,支持模型推理和监督式微调(SFT),并且完全兼容最新的Keras 3.0。
- 通过预置的Colab和Kaggle notebooks,以及与Hugging Face、MaxText、NVIDIA NeMo和TensorRT-LLM等流行工具的集成,用户可以轻松开始探索Gemma。
- Gemma模型既可以在个人笔记本电脑和工作站上运行,也可以在Google Cloud上部署,支持在Vertex AI和Google Kubernetes Engine (GKE) 上的简易部署。
- 谷歌还对Gemma进行了跨平台优化,确保了它在NVIDIA GPU和Google Cloud TPU等多种AI硬件上的卓越性能。