复制成功

分享至

主页 > 比特币 >

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

2023.10.10
支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

图片来源:由无界 AI生成

2023年10月9日,成立仅半年的大模型初创公司 —— Moonshot AI宣布在“长文本”领域实现了突破,推出了首个支持输入20万汉字的智能助手产品Kimi Chat。这是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,标志着Moonshot AI在这一重要技术上取得了世界领先水平。

从技术上看,参数量决定了大模型支持多复杂的“计算”,而能够接收多少文本输入(即长文本技术)则决定了大模型有多大的“内存”,两者共同决定模型的应用效果。支持更长的上下文意味着大模型拥有更大的“内存”,从而使得大模型的应用更加深入和广泛:比如通过多篇财报进行市场分析、处理超长的法务合同、快速梳理多篇文章或多个网页的关键信息、基于长篇小说设定进行角色扮演等等,都可以在超长文本技术的加持下,成为我们工作和生活的一部分。

相比当前市面上以英文为基础训练的大模型服务,Kimi Chat具备较强的多语言能力。例如,Kimi Chat在中文上具备显著优势,实际使用效果能够支持约20万汉字的上下文,2.5倍于Anthropic公司的Claude-100k(实测约8万字),8倍于OpenAI公司的GPT-4-32k(实测约2.5万字)。同时,Kimi Chat通过创新的网络结构和工程优化,在千亿参数下实现了无损的长程注意力机制,不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。

目前,Moonshot AI 的智能助手产品Kimi Chat已开放了内测。


大模型输入长度受限带来的应用困境


当前大模型输入长度普遍较低的现状对其技术落地产生了极大制约,例如:

目前大火的虚拟角色场景中,由于长文本能力不足,虚拟角色会轻易忘记重要信息,例如在Character AI的社区中用户经常抱怨“因为角色在多轮对话后忘记了自己的身份,所以不得不重新开启新的对话”。

对于大模型开发者来说,输入prompt长度的限制约束了大模型应用的场景和能力的发挥,比如基于大模型开发剧本杀类游戏时,往往需要将数万字甚至超过十万字的剧情设定以及游戏规则作为prompt加入应用,如果模型输入长度不够,则只能削减规则和设定,从而无法达到预期游戏效果。

在另一个大模型应用的主要方向——Agent中,由于Agent运行需要自动进行多轮规划和决策,且每次行动都需要参考历史记忆信息才能完成,这会带来了模型输入的快速增加,同时也意味着不能处理更长上下文的模型将因为无法全面准确的基于历史信息进行新的规划和决策从而降低Agent运行成功的概率。

在使用大模型作为工作助理完成任务的过程中,几乎每个深度用户都遇到过输入长度超出限制的情况。尤其是律师、分析师、咨询师等职业的用户,由于常常需要分析处理较长的文本内容,使用大模型时受挫的情况发生频率极高。

而上述所有的问题在大模型拥有足够长的上下文输入后都将会迎刃而解。


长文本打开大模型应用的新世界


那么拥有超长上下文输入后的大模型会有怎样的表现?下面是一些Kimi Chat实际使用的例子:

公众号的长文直接交给Kimi Chat ,让它帮你快速总结分析

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

新鲜出炉的英伟达财报,交给Kimi Chat,快速完成关键信息分析:

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

出差发票太多?全部拖进Kimi Chat,快速整理成需要的信息:

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

发现了新的算法论文时,Kimi Chat能够直接帮你根据论文复现代码:

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

只需要一个网址,就可以在Kimi Chat中和自己喜欢的原神角色聊天:

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

输入整本《月亮与六便士》,让Kimi Chat和你一起阅读,帮助你更好的理解和运用书本中的知识:

支持20万字输入,Moonshot AI开启千亿大模型的“长文本”时代

通过上述例子,我们可以看到,当模型可以处理的上下文变得更长后,大模型的能力能够覆盖到更多使用场景,真正在人们的工作、生活、学习中发挥作用,而且由于可以直接基于全文理解进行问答和信息处理,大模型生成的“幻觉”问题也可以得到很大程度的解决。


不走捷径,解决算法和工程的双重挑战


长文本技术的开发,存在一些对效果损害很大的“捷径”,主要包含以下几个方面:

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier