复制成功

分享至

主页 > 比特币 >

业界领先的这些大模型,都被一家「收编」了

2023.10.13
业界领先的这些大模型,都被一家「收编」了

图片来源:由无界 AI生成

毋庸置疑,GPT-4 发布是一件足以载入 AI 史册的大事件。但随着时间的推移,人们也发现,即使是最先进的大模型也还没有强大到可以把所有的事情都做完。比如,如果你把一份很长的文本粘贴到 GPT-4 的对话框,它会告诉你文本过长,处理不了(它支持的上下文窗口仅为 32k token,约 2.5 万汉字)。

再比如,如果你需要算一个超过 8 位数字乘法的运算,或者涉及小数、分数的运算,GPT-4 可能也给不出正确答案(其多位乘法运算准确率仅为 4.3%)。 

业界领先的这些大模型,都被一家「收编」了

看起来,现阶段我们并没有实现理想中的「通用人工智能」,强如 GPT-4 也并不完美。这也意味着,对于大模型使用者或者想在其上开发应用的技术人员来说,GPT-4 或许不是唯一的选择,甚至不是最适合的选择。

那么,在生成式 AI 的下半场,应用到底应该怎么造?这并不是一个能够简单得出答案的问题,很多时候,我们恨不得把现有的比较强的模型都试一下。但即使要做这件事也不容易,因为很多模型在发布的同时其实并没有提供太多「配套服务」,试用也有成本和代价。

好在,拥有强大基础设施的亚马逊云科技也关注到了这些问题。近日正式上线的 Amazon Bedrock 就是奔着「提供更多选择」和配套服务这一目标来的。


Claude、Llama 2、Stable Diffusion... 超全明星模型库


除了 ChatGPT,在更多领域中,人们想要应用生成式 AI 还存在肉眼可见的挑战:我们必须构建专用于生成式 AI 的硬件基础设施,配合自身数据对大模型进行调优,不断更新部署,同时还需要保护隐私数据的安全。即使对于科技公司而言,这也是非常复杂的事。

对此,亚马逊云科技拿出了一套帮助人们建大模型应用的「基础设施」。

今年 4 月,亚马逊云科技正式发布 Amazon Bedrock,这是一套生成式 AI 全托管服务,包含业界领先的基础模型和构建生成式 AI 应用程序所需的一系列功能。

业界领先的这些大模型,都被一家「收编」了

Amazon Bedrock 汇聚了业内几乎所有领先的基础大模型,面对不同应用场景,它可以让人们只需通过单一 API 就能用上来自 AI21 Labs、Anthropic、Cohere、Meta Llama2、Stability AI 等公司的先进大模型来构建自己的应用。

提到亚马逊,很多人可能都会想到前段时间的一个重要融资事件:他们计划对 OpenAI 头号竞争对手 ——Anthropic 投资 40 亿美元。

在大模型创业领域,Anthropic 是一个非常耀眼的存在。它由 OpenAI 前研究副总裁 Dario Amodei、GPT-3 论文第一作者 Tom Brown 等人在 2021 年共同创立,其创始成员大多为 OpenAI 的核心员工,他们曾经深度参与过 OpenAI 的 GPT-3,率先提出引入人类偏好的强化学习(RLHF)等技术。

业界领先的这些大模型,都被一家「收编」了

这套强大的阵容打造出了一个同样耀眼的模型 ——Claude(最新版本是 Claude 2)。在某些方面,这个模型甚至做到了 GPT-4 都没做到的事情,比如 100k token 的上下文窗口,其代码生成能力也超过了原版的 GPT-4。这些都是亚马逊选择投资 Anthropic 的重要原因。

更重要的是,亚马逊云科技发布的新闻中有这么一段话:「作为投资协议的一部分,Anthropic 将使用亚马逊云科技的服务承担关键任务工作负载,合作进行安全研究和未来基础模型开发。使用亚马逊云科技的开发人员和工程师将能够通过 Amazon Bedrock 在 Anthropic 最先进的模型基础上构建应用。」

没错,应用生成式 AI,现在有了新的思路:有人把表现优秀的模型上线到 AI 基础设施平台上,让用户去选什么是最合适的。为了扩大操作的范围,Amazon Bedrock 不仅上线了 Claude 2,还有开源界的扛把子 Llama 2 以及口碑同样很好的 Jurassic-2、Command 等模型。

Jurassic-2 来自 AI21 Labs,是业内规模最大,性能最强的几种基础大模型之一。在 Amazon Bedrock 上甚至提供了超千亿参数的 Ultra 版本,其可以应用于任何复杂的语言生成任务,例如问答、摘要、长格式副本生成、高级信息提取等,也支持多种语言。

Command 则是另一家明星创业公司 Cohere 推出的,可够接受用户个性化命令训练的文本生成模型。企业用户在将自己的数据和 Command 结合之后,就可以生成一个面向特定应用的语言模型,能在实际业务中立即发挥作用。在 520 亿参数的体量之上,Command 的性能超过了很多更大的模型。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier