复制成功

分享至

主页 > 数字货币 >

估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram

2024.03.11

文章来源: 硅星人Pro

文章作者:Jessica


图片来源:由无界AI生成 图片来源:由无界AI生成


当OepnAI和马斯克连日互杠、Google因文化偏见麻烦缠身、号称抢走GPT-4王位的Claude 3全力瞄准企业级部署的时候,在另一个角落,致力于「为每个人开发服务型AI」的人工智能初创公司Inflection AI,悄悄更新了他们的聊天机器人Pi,以及为之提供支持的新一代大模型Inflection-2.5。

估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram


对一些人来说Inflection AI这个名字可能还不太熟悉,实际上它也是业界第一梯队的佼佼者,甚至每日的使用时长已经超过了 Instagram (根据Pi最新公布的数据,用户平均一次对话,时长就达到惊人的33分钟,而根据Sprout Social的统计,Instagram 的用户平均每日使用时长为29分钟)。去年6月从微软、英伟达、比尔·盖茨、LinkedIn联合创始人雷德·霍夫曼和谷歌前CEO埃里克·施密特手里融了13亿美元,估值超过40亿美元,成为彼时人工智能领域融资量仅次于Open AI的第二大独角兽。


此次公布的Inflection-2.5是公司开发的第三代大模型,被官方称为目前“世界上最好的个人人工智能”。它在去年11月Inflection-2版本上进行了全面升级,“给卓越的情商进一步增加智商”:性能表现逼近GPT-4,但训练所用的计算量却只占其40%。同时具备世界级的网络实时搜索能力, 确保准确提供高质量的即时新闻和最新信息。

性能看齐 GPT-4,算力只需40%


具体来看,初代Inflection-1通过使用GPT-4的4%训练FLOPs,达到了GPT-4性能的72%。而刚发布的Inflection-2.5,仅使用了GPT-4训练FLOPs的40%,就在平均性能上实现显著提升,超过了GPT-4水平的94%,其中STEM(科学、技术、工程、数学)领域的增益最大。

估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram


官方测试了升级版对匈牙利数学考试以及物理学研究生入学GRE考试的表现。发现Inflection-2.5在maj@8中能排到人类考生的前15%,在maj@32中几乎可以跻身前5%,接近GPT-4的前3%。

估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram


MBPP+和HumanEval+两个编程测试上模型能力也较Inflection-1显著跃升。在HellaSwag和ARC-C代表的常识推理和深度自然语言理解评估中,Inflection-2.5继续进步,给出接近饱和的强劲表现。

估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram


说实话,与各路主流LLM 动不动就碾压“业界黄金标准”GPT-4相比,Inflection-2.5的各项数字顶多算不错,实在说不上突出。有网友就搬出刚引发热潮的Claude 3无情打击道:“我猜Anthropic 正在嘲笑 Inflection 新出炉的性能测试结果!除了采用新的计算方法,我看不出Inflection 2.5 到底有什么进步!”

估值40亿的Pi大更新:性能接近 GPT-4,日均使用时长已经超过 Instagram


但帖子马上在评论区遭到反对,“Pi的目标从来都不是像成为GPT-4或Claude 3那样的通才能力型AI。他们想要的是一款友好的,能和人产生共鸣的AI,就像一位心理学家或朋友。”

不做生产力工具,主打走心陪伴


这位用户也一语道出了Inflection AI与大部分人工智能公司的不同。


在大模型竞争乱花迷眼的今天,各家都在找寻属于自己的赛道。但无论是OpenAI、Google、Anthropic,还是引领开源的Meta和Mistral AI,都把实现安全负责的AGI作为践行使命之一。而Inflection AI则在自己的官网清楚表示:“我们并不致力于发展通用人工智能。我们相信,先进的应用型人工智能才是利用这些新技术的最安全方式。”


换句话说,Inflection从未把专业性和替代人工当作宣传,他们希望做一个真正了解和关心用户的「个人AI伴侣」,“ AI需要为你服务。这就是我们构建AI的原因。”

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier