复制成功

分享至

主页 > 数字货币 >

全面剖析Claude 3.0:“地球最强”AI模型的优劣详解

2024.03.06

文章来源:腾讯科技

文章作者: 郭晓静 郝博阳


图片来源:由无界AI生成 图片来源:由无界AI生成


Anthropic发布Claude 3.0,一夜之间,关于“Claude3.0超越GPT-4成为地球最强模型”的消息刷屏。对于其他模型,即便它们在各种基准测试中取得了高分,如果没有经过实际使用和测试,业内人士往往不会轻易相信它们真的能够超越GPT-4。然而,当宣称赶超的是Anthropic的Claude时,情况就不同了。Anthropic毕竟是与OpenAI一脉相承的“德比”,Claude 3.0也是最有机会挑战GPT-4的模型。

全面剖析Claude 3.0:“地球最强”AI模型的优劣详解

速览Claude 3.0


鉴于已经有很多关于Claude 3.0的解读文章,我们在文章开头从五个方面速览Claude 3.0的技术要点及某些性能指标:


① 模型概述:


Claude 3.0 共发布三款模型:Opus、Sonnet、Haiku:"Opus"代表了最高级、最智能的模型。这个词源自拉丁语,原意是“史诗级的作品”,在音乐领域尤其常见,用来指代一部完整的音乐作品;"Sonnet"代表了中等级别的模型,它在性能和成本效益之间取得了平衡。这个名字来源于文学中的“十四行诗”(Sonnet),这是一种具有特定结构和韵律的诗歌形式,通常包含14行;"Haiku"代表了入门级别或最基础的模型。这个名字来源于日本的一种传统短诗形式——俳句(Haiku),它通常由三行组成,遵循5-7-5的音节模式。俳句以其简洁和深邃的表达而著称,这与Claude 3.0 Haiku模型的特性相呼应。不得不说,这三个名字,起的既有文化底蕴又形象。不过,我们普通人可以简单理解为,超大杯、大杯、中杯。

1)超大杯 Opus:最强大、最智能。在AI系统评估基准上,如MMLU、GPQA、GSM8K等,表现出超越同行的性能。

2)大杯Sonnet:性价比最高。在大多数工作负载中,比Claude 2和Claude 2.1快2倍,同时保持更高的智能水平。

3)中杯 Haiku:成本最优。作为市场上速度最快、成本效益最高的模型,能够在短时间内(不到3秒)阅读约10k tokens的信息和数据密集型研究论文。


② 最优表现及技术亮点


1)速度:支持实时反馈,自动完成数据提取任务-Haiku可以三秒内读取arXiv上一篇信息和数据密集的研究论文(大约10K Token),并附带图形。

2)准确性提高:Claude 3.0 Opus:在挑战性开放式问题上,正确答案率是Claude 2.1的两倍。

3)上下文处理能力提高,且记忆力完美:初始提供200K的上下文窗口,但所有模型都能处理超过1百万token的输入。Claude Opus实现了接近完美的召回率,准确率超过99%。

4)模型易用性提高:善于遵循复杂的多步骤指令,能够产生JSON等机构化输出。

5)责任及安全性:虽然与之前的模型相比,Claude 3.0 系列模型在生物知识、网络相关知识和自主性等关键指标上取得了进步,但根据“负责任扩展政策(Responsible Scaling Policy)”,仍处于 AI 安全等级 2(ASL-2)。红队评估结果显示,Claude 3.0 系列模型目前造成灾难性风险的可能性微乎其微。

6)减少拒绝:与前代模型相比,减少了不必要的拒绝,提高了对请求的理解和处理能力。

7)使用了合成数据:数据被认为是大模型训练未来将要面临的重要瓶颈,在Claude 3.0的技术文档中,我们看到Antropic已经使用合成数据训练Claude 3.0。

全面剖析Claude 3.0:“地球最强”AI模型的优劣详解


③ 成本


1.Claude 3.0 Opus:

a.  输入成本:$15/百万tokens

b. 输出成本:$75/百万tokens

2.Claude 3.0 Sonnet:

a. 输入成本:$3/百万tokens

b. 输出成本:$15/百万tokens

3.Claude 3.0 Haiku:

a. 输入成本:$0.25/百万tokens

b. 输出成本:$1.25/百万tokens

这些价格反映了不同模型的性能和复杂度。Opus作为最高级模型,提供了最高的智能水平,因此价格也最高。Sonnet提供了性能和成本之间的平衡,而Haiku作为最快的模型,提供了最低的成本,适合需要快速响应的应用。


④ 目前是否已经可以使用:


Opus和Sonnet:现已在159个国家通过API提供使用。

Haiku:即将推出。


⑤ 未来计划:


Anthropic计划在未来几个月内频繁更新Claude 3.0模型家族,并发布新功能,如Tool Use(功能调用)、interactive coding(交互式编码)等。

全面剖析Claude 3.0:“地球最强”AI模型的优劣详解


Claude 3.0是否真的很强大

全面剖析Claude 3.0:“地球最强”AI模型的优劣详解

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier