复制成功

分享至

主页 > 数字货币 >

ChatGPT之外,美国大模型搞到什么程度了?

2023.12.28

原文来源:华商韬略

作者 | 王梦欣

ChatGPT之外,美国大模型搞到什么程度了?

图片来源:由无界 AI‌生成

年初以来,OpenAI以ChatGPT在全球掀起AI大模型热潮。但美国的AI大模型,远不止于OpenAI的ChatGPT。


01 井喷式发展


综合各种数据,虽然中国发展势头迅猛,但美国依然是全球发布大模型最多的国家,到2023年5月,其10亿级参数规模以上的基础大模型就已突破100 个。

《经济学人》报道,美国2022年大模型投资总额达474亿美元,是第二名中国(134亿美元)的约3.5倍,且仍保持激增态势。高盛则进一步预测,美国2025年大模型相关投资可达千亿美元,约全球的1/2。

高盛的调查显示,罗素3000指数公司中有16%的公司在2023年的财报会议中提到了大模型,其经济学家估计,大模型将在十年内提高1%的整体劳动生产率,并为标普500指数带来约14%的增长。

除了ChatGPT,美国如今具有代表性的通用大模型公司还包括:Anthropic、Cohere以及Google等。

其中,由OpenAI前高管Dario和Daniela Amodei等人于2021年自立门户创办的Anthropic,目前估值已达300亿美元,是仅次于OpenAI(约860亿美元估值)的通用大模型企业。

Anthropic拥有多位参与过GPT-2与GPT-3研发的前OpenAI核心员工,其大模型产品Claude2也被认为是仅次于ChatGPT-4的经典力作,甚至有分析师认为,Claude2的性能优于ChatGPT-4。

ChatGPT之外,美国大模型搞到什么程度了?

比如,Claude2可以处理多达约75000个单词的数据集,而ChatGPT大约是3000个,这意味着它可以处理和输出更复杂的内容,也被应用到更有挑战性的领域,比如生成数千字的长文内容。

更让Claude2积攒人气的是,它直接免费向公众开放,而不是像GPT-4一样需要付费使用。

优秀的创始团队和强大的产品性能,让Anthropic备受资本追捧,谷歌、韩国最大移动运营商之一SK Telecom(SKT)、亚马逊都已成为其投资者,其中仅亚马逊的投资就高达40亿美元。

在Anthropic之外,还有一家令人称道的公司便是Cohere。

今年6月,2019年创立的Cohere获得NVIDIA、Oracle、Salesforce Ventures等投资的2.7亿美元,成为估值20亿美元的独角兽,也是估值仅次于OpenAI和Anthropic的基础大模型公司。

Cohere同样以强大创始团队备受业内瞩目,其创始人之一Aidan Gomez是大语言模型领域开创性论文《Attention is All You Need》的最年轻作者,正是这篇文章首次提出了著名的Transformer架构,成为通用大模型发展的基础模型,ChatGPT就是在这一架构的基础上诞生。

ChatGPT之外,美国大模型搞到什么程度了?

▲Cohere推出的第一个生成式AI应用Coral

Cohere与OpenAI提供的产品类似,但它看到了“数据隐私”这个市场机会,将自己与OpenAI的定位区分开来,选择了ToB赛道,坚定地走商用大模型的路线。其产品基础能力包括三大类:文本检索,文本生成和文本分类,并且可针对客户需求,强调安全性,隐私以及定制化服务。

Cohere的另一大卖点是,不受任何云端平台限制,进而保障资料的私密安全性。它提供灵活性存储和资料隐私保护路径,可使用户实现本地部署,以满足客户资料存储不同位置的需求。

Cohere能迅速转向,找到自己的差异化定位,离不开Aidan及其联合创始人独特的人才观和创业哲学。

Aidan曾表示,Cohere寻找不同背景但对AI非常感兴趣并富有雄心的人:他不一定有大公司的漂亮履历,但是一定要对自己专注的领域有非常高的兴趣和热情,而且不光会写论文,还要有实际动手的能力。

差异化的产品战略,与众不同的团队背景,让Cohere成为通用大模型领域的一股清流。

日前,Cohere发布了全球首个公开可用的多语言理解模型,该模型基于来自母语人士的真实数据进行训练,能够阅读和理解全球超过100种最常用的语言。

再来看巨头Google 。

12月6日,Google DeepMind重磅推出了多模态AI模型Gemini,可以同时横跨文字、图片、影音、程式码等多模态进行学习与理解。

以客服机器人的应用为例,使用Gemini作为模型不仅能够从对话的字面意思上理解客户,更能同时从表情、声调接收到客户话语中的意图,能处理包括音讯、程式码、图像、视讯等内容。

ChatGPT之外,美国大模型搞到什么程度了?

据实测结果,Gemini是第一个在大模型多任务语言理解上超越人类专家的模型,且在32项AI测试中,有30项测验结果超过GPT-4。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier