复制成功

分享至

主页 > 数字货币 >

AI长文本之战:Kimi快跑,大厂围剿

2024.03.29

文章来源:智能涌现

文|周鑫雨

编辑|苏建勋


图片来源:由无界AI生成 图片来源:由无界AI生成


一条名为“Kimi”的鲶鱼,将大模型公司卷到了长文本的新战场。

这款来自AI独角兽月之暗面的大模型对话产品,最大的标签就在于“长”。上下文窗口的大小,代表着一个模型的记忆力。窗口越长,模型单次可处理的文本就越长。对用户而言,模型能读懂的文字越多,在学习、工作等场景下就越有用。

深谙营销之道的月之暗面,是国内乃至全球范围内,第一家将“长文本”作为标签的大模型公司。2023年10月30日,打着“全球首个支持输入20万汉字”名号的Kimi Chat就快速在一堆卷榜单、卷参数的模型中,拥有了辨识度。

Kimi有多火?国信证券的调研显示,从2023年10月到2024年3月,Kimi的DAU从10万攀升到了300多万,翻了30倍。自春节起大规模投放广告后,SimilarWeb数据显示,Kimi的访问量在2月增长了107.6%,仅次于百度的文心一言和阿里的通义千问。3月21日,无法承接过多用户的Kimi App和小程序一度宕机,用户需要排队才能正常使用。

Kimi的爆火,还直接牵动了股市——一些与月之暗面有合作传闻的上市公司,被冠以“Kimi概念股”之名,股价飙升。后续纷纷出来辟谣的海天瑞声、中广天择,已经先吃上了Kimi的红利,在3月20日应声涨停。这段时间,沪深互动平台最多的问题是“公司是否与Kimi助手有合作”,又或是“公司有接入Kimi吗”。


AI长文本之战:Kimi快跑,大厂围剿

△网上流传的“Kimi概念股”名单


在2024年3月24日的一场用户活动上,月之暗面的几位产品负责人直言:“我们不敢说太多,还是希望大家关注产品本身。”

而一场对Kimi的长文本围剿战,也已经在大厂中打响。3月23日,360 AI 浏览器宣布内测500万字长文本处理功能。百度的文心一言也被曝将在4月开放长文本功能,长度在200万-500万。阿里的通义千问则一口气免费开放了1000万字的长文档处理功能,坐上了“全球第一长”的宝座。


可炮制的技术,被验证的需求


Kimi带起的长文本之火,无外乎两个原因:技术门槛不高,市场需求已经被月之暗面初步验证。

2023年10月9日,Kimi带着“全球首个支持输入20万汉字”的标签走进大众视野。彼时,这一上下文窗口长度达到了Claude-100K(约8万字)的2.5倍,GPT-4-32K(约2.5万字)的8倍。

不过,多名从业者对36氪表示,长文本处理的技术壁垒并不高。长文本建模的方案,主要有外部召回(借助外部工具处理长文本或者利用外部记忆存储上下文向量)、模型优化、注意力计算优化三种,而每一种都有公开的研究论文和技术方案。

很快,Kimi“20万字”的记录就被他人打破。2023年10月30日,Kimi首发仅过了21天,王小川的百川智能就推出了上下文窗口达192K的大模型Baichuan2-192K,单次能处理35万个汉字。11月,王座再次易位,李开复成立的零一万物,又发布了能够处理约40万字的大模型Yi-34B,是Kimi的约2倍。

长文本带来的模型竞速,最根本的原因,还是在于看到了庞大的消费群体。

“C端用户对大模型的需求无外乎两种,一是提效工具,二是娱乐工具。”一名AI从业者告诉36氪。他认为,目前AI对短文本的理解和生成能力,还没完全超过人类,比如看咨询、写短文案,“人用在修改AI生成的文案的时间,其实不比自己从头想来的少。”

但大模型相较于人的竞争力,恰恰在于理解长文本的效率。“10万字的论文,一般人读完起码要30小时,还是在不休息的情况下,但大模型只要几分钟。”一名法律行业AI产品经理向36氪提及,问答机器人、模拟法庭等AI产品在专业度高、实践性强的法律行业都跑不通,唯一能跑通的只有对判决文书等长文本的总结,而“Kimi是目前律师等法律专业用户认可度最高的一款AI产品”,不少律师用Kimi来总结资料,输出法律文书。

Kimi的火爆,是苦于C端变现途径的大厂所垂涎的。在大模型落地的打法上,体系庞大的大厂们,采用的基本是模型+云服务、AI功能+原有产品的保守打法。在B端,这样的打法初见成效。百度在2023年的财报中,强调了大模型对云等B端业务的推动。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier