英伟达独霸时代结束?C
谷歌全面反击!PaLM 2模型挑战GPT-4,产品通通AI化
来源:澎湃新闻
记者 邵文
·PaLM 2模型提供了不同规模的四个版本,其中轻量级的Gecko模型可以在移动设备上运行,速度非常快,不联网也能在设备上运行。谷歌还推出了两个专业领域大模型,其中,Med-PaLM 2能回答各种医学问题,是首个在美国医疗执照考试中达到专家水平的大语言模型。
谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 在2023年I/O开发者大会上。
在ChatGPT推出之后,谷歌一度发布内部“红色警报”(red code),被媒体称为遭遇“柯达时刻”(形容胶卷被数码照相替代)。久被唱衰之后,谷歌在北京时间5月11日的最新一届I/O开发者大会上官宣大语言模型PaLM 2(Pathways Language Model 2),称其在部分任务上超越GPT-4。
谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)在加州山景城海岸圆形剧场的演讲中表示,PaLM 2是该公司最新的AI模型,同时谷歌的研究重心正在转向开发更大的模型Gemini,这是一种多模态和高效的机器学习工具。
除此之外,谷歌也官宣会将Duet AI整合进谷歌办公全家桶Workspace;聊天机器人Bard全面升级并向所有人开放;谷歌云将上线多个基础大模型,为行业提供更进一步的生成式AI服务,等等。
在长达两个小时的演讲中,谷歌抛开以往的谨慎形象,从各个角度介绍了最新的大模型技术如何应用在了谷歌产品体系的几乎所有方面。
皮查伊宣布PaLM 2。(02:18)
PaLM 2部分结果超越GPT-4
实际上,这一波由ChatGPT带来的AI热潮,其背后关键技术即是2017年谷歌提出的transformer架构。2022年4月,PaLM第一个版本的模型发布。而在微软和OpenAI在大模型技术上先声夺人之后,这一次PaLM 2的发布显然被谷歌寄予厚望。
在I/O开发者大会上,皮查伊宣布推出PaLM 2预览版本,利用谷歌最新的TPU算力基础设施提升了训练速度。由于它的构建方式是将计算、优化扩展、改进的数据集混合以及模型架构改进结合在一起,因此服务效率更高,同时整体表现更好。
PaLM 2模型提供了不同规模的四个版本,从小到大依次为“壁虎” (Gecko),“水獭”(Otter)、“野牛”(Bison)、“独角兽”,更易于针对各种用例进行部署。其中轻量级的Gecko模型可以在移动设备上运行,速度非常快,不联网也能在设备上运行出色的交互式应用程序。
PaLM 2在超过100种语言的多语言文本上进行了训练。
据介绍,PaLM 2在超过100种语言的多语言文本上进行了训练,这使得它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。
PaLM 2的数据集中有海量论文和网页,其中包含非常多的数学表达式。在这些数据的训练后,PaLM 2能轻松解决数学问题,甚至是制作图表。
根据基准测试,对于具有思维链prompt(提示)或自洽性的MATH、GSM8K和MGSM基准评估,PaLM 2的部分结果超越了GPT-4。
根据基准测试,PaLM 2的部分结果超越了GPT-4。
PaLM 2 是在具有100+语言的语料库上进行训练的,因此它更擅长多语言任务,能够理解、生成和翻译比以往模型更细致多样化的文本。
PaLM 2 通过了“精通”(mastery)级别的高级语言能力考试。比起PaLM,在最新专业语言熟练度考试中的表现,PaLM 2的日语水平达到了A级,而PaLM达到了F级。PaLM 2的法语水平达到了C1级。在相关论文中,谷歌工程师声称PaLM 2的语言能力已经“足以教授这门语言”,原因是其训练数据中的非英语文本更为普遍。
编程方面,PaLM 2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。
此外,基于PaLM 2,谷歌还推出了两个专业领域大模型。一个是谷歌健康团队打造的Med-PaLM 2,它能回答各种医学问题,据介绍是首个在美国医疗执照考试中达到专家水平的大语言模型。
谷歌健康团队打造的Med-PaLM 2。
目前谷歌正在尝试让它具备多模态能力,比如检查X光片然后给出诊断。在今年夏天晚些时候,这个模型将对一小部分谷歌云用户开放。