复制成功

分享至

主页 > 数字货币 >

“像近年的苹果发布会,并无新意”,专家吐槽谷歌 Gemini:只是小进步,飞跃谈不上

2023.12.07
“Gemini 是这波生成式 AI 浪潮的顶峰,但并非下一个高峰的开端。”
“像近年的苹果发布会,并无新意”,专家吐槽谷歌 Gemini:只是小进步,飞跃谈不上

图片来源:由无界 AI生成

12 月 6 日晚,谷歌 DeepMind 推出了其“迄今为止最强大、最通用的模型”Gemini。一位观察家表示,Gemini 是一台“万能机器”,在各种性能上都是同类最佳的。谷歌及其母公司 Alphabet 的首席执行官桑达尔 - 皮查伊(Sundar Pichai)在接受采访时也表示:“这对我们来说是向前迈出的一大步。”

是的,对于谷歌而言,相比此前饱受诟病的 Bard,Gemini 是进步,但对整个 AI 领域来说未必是一个巨大的飞跃。

作为对 OpenAI GPT-4 的回应,谷歌 DeepMind 声称,Gemini 在 32 项标准性能指标中,有 30 项指标都优于 GPT-4。然而,它们之间的差距其实是微乎其微的。谷歌 DeepMind 所做的,其实只是将人工智能目前最好的能力整合到一个强大的软件包中。从演示来看,它在很多方面都做得很好,但很少有我们以前没见过的东西。

Gemini 可能是一个迹象,表明我们已经达到了人工智能炒作的顶峰。至少现在是这样。

华盛顿大学专门研究在线搜索的教授 Chirag Shah 把这次发布比作苹果公司近年推出的新款 iPhone。他说:“也许我们现在只是上升到了一个不同的阈值,在这个阈值上,这并没有给我们留下那么深刻的印象,因为我们已经看过太多(类似的产品和功能了)。”

与 GPT-4 一样,Gemini 也是多模态的,这意味着它经过训练可以处理多种输入:文本、图像、音频。它可以将这些不同的格式结合起来,回答从家务到大学数学到经济学等各种问题。

在昨天为记者进行的演示中,谷歌展示了 Gemini 的性能,它可以截取现有图表的截图,分析数百页的研究报告和新数据,然后根据新信息更新图表。在另一演示中,Gemini 显示了在平底锅中烹饪蛋饼的图片,并询问(使用语音而非文字)蛋饼是否已经熟透。Gemini 也能准确地答上来:“还没熟,因为蛋液还是流动的。”

目前,Gemini 还未完全上线。今天推出的版本是谷歌基于文本的搜索聊天机器人 Bard 的后端。Gemini 的全面发布将在未来几个月内分期进行。经过 Gemini 强化的新 Bard 最初将在 170 多个国家(不包括欧盟和英国)提供英语版本。负责 Bard 的谷歌副总裁 Sissie Hsiao 说,这是为了让公司与当地监管机构“接触”。

具体而言,Gemini 有三种规格:Ultra、Pro 和 Nano。其中,Ultra 是全功率版本;Pro 和 Nano 则是为计算资源有限的应用程序量身定制的。Nano 则专为在谷歌新款 Pixel 手机等设备上运行而设计。开发人员和企业将从 12 月 13 日开始访问 Gemini Pro。Gemini Ultra 是功能最强大的规格,将在“明年初经过”广泛的信任和安全检查“后推出。

“我认为大模型已经到了 Gemini 时代,”皮查伊表示。“这就是谷歌 DeepMind 在人工智能领域的构建和进步方式。它永远代表着我们在人工智能技术方面取得进展的前沿。”


更大、更好、更快、更强?


OpenAI 最强大的模型 GPT-4 被视为业界的黄金标准。虽然谷歌夸口说 Gemini 比 OpenAI 之前的模型 GPT 3.5 性能更强,但公司高管回避了关于该模型比 GPT-4 强多少的问题。

在与同类大模型相比时,谷歌特别强调了一个名为 MMLU(大规模多任务语言理解)的基准。这是一套测试,旨在衡量模型在涉及文本和图像的任务中的表现,包括阅读理解、大学数学以及物理、经济和社会科学方面的多项选择测验。皮查伊说,在纯文本问题上,Gemni 的得分率为 90%,人类专家的得分率约为 89%,而 GPT-4 在这类问题上的得分率为 86%。在多模态问题上,Gemini 的得分率为 59%,而 GPT-4 的得分率为 57%。皮查伊说:“这是第一个跨过这个门槛的模型。”

“像近年的苹果发布会,并无新意”,专家吐槽谷歌 Gemini:只是小进步,飞跃谈不上

的确,在数据上,Gemini 的成绩好于 GPT-4,但真的不多。

新墨西哥州圣达菲研究所(Santa Fe Institute)的人工智能研究员 Melanie Mitchell 就表示,“很明显,Gemini 是一个非常复杂的人工智能系统。”但“在我看来,Gemini 的能力实际上并没有明显超过 GPT-4,”她补充说。

此外,斯坦福大学基础模型研究中心主任 Percy Liang 也谈到,虽然该模型有很好的基准分数,但由于我们不知道训练数据的内容,因此很难解释这些数据。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier