复制成功

分享至

主页 > 数字货币 >

together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资

2023.12.21

原文来源:阿尔法公社

together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资

图片来源:由无界 AI生成

目前获得融资最多的两家大模型创业公司是OpenAI和Anthropic,而这两家公司最大的投资者分别是微软和亚马逊,他们投资的很大一部分不是资金,而是等值的云计算资源。这其实也就把这两家顶尖的闭源大模型公司“绑上了”科技巨头的“战车”。

在闭源大模型之外,还有另一个阵营是开源大模型,MetaAI的llama系列就是其中的代表。Meta还牵头组建AI联盟(AI Alliance),旨在推进人工智能领域的开源发展,对抗AI闭源巨头如OpenAI和英伟达。

使用开源大模型做应用的创业公司,大部分也希望保持自己的独立性,会使用多云策略,而一个能力强,成本低的AI云平台就非常需要。

together.ai就是一个为AI创业公司提供训练,推理服务云平台的公司,事实上,它也是一个拥抱开源生态的全栈AI公司,拥有自己的模型和数据集,在AI底层技术方面有很深的积累。

together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资

近日,together.ai获得Kleiner Perkins领投的1.025亿美元A轮融资,NVIDIA和Emergence Capital等投资者也参与本轮,其他的投资者还包括NEA、Prosperity7、Greycroft、137 Ventures和Lux Capital、Definition Capital、Long Journey Ventures、SCB10x、SV Angel等Together种子轮的投资者。

它的种子轮投资者除了机构外,还包括IronPort联合创始人Scott Banister、Cloudera联合创始人Jeff Hammerbacher、Oasis Labs创始人Dawn Song、OpenSea联合创始人Alex Atallah等。本轮融资是公司之前融资规模的五倍,累计融资额1.2亿美元。

together.ai的联合创始人兼CEO Vipul Ved Prakash表示:“如今,训练、微调或产品化开源生成AI模型极具挑战性。当前的解决方案要求企业在人工智能方面拥有重要专业知识,同时能够管理大规模基础设施。together.ai平台一站式解决了这两大挑战,提供了易于使用和获取的解决方案。我们的目标是帮助创建超越封闭模型的开放模型,并将开源作为整合人工智能的默认方式。


苹果前高管和大学教授打造AI开源云平台



together.ai创建于2022年6月,联合创始人包括Vipul Ved Prakash、Ce Zhang、Chris Re和Percy Liang。

together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资

Prakash此前创立了社交媒体搜索平台Topsy,该平台于2013年被苹果收购,随后他成为苹果的高级总监。

Ce Zhang是苏黎世联邦理工学院计算机科学副教授,领导“去中心化”人工智能的研究。

Percy Liang是斯坦福大学计算机科学教授,指导该校的基础模型研究中心(CRFM)。

Chris Re共同创立了多家初创公司,包括SambaNova,该公司为人工智能构建硬件和集成系统。

Prakash表示:“去年Chris、Percy、Ce和我聚在一起时,我们都清楚地感觉到,AI基础模型代表了技术的一次代际转变,而且可能是自晶体管发明以来最重要的一次。

与此同时,过去几十年在人工智能创新中领先的开源社区在塑造即将到来的人工智能世界方面的能力有限。

我们看到这些模型趋向于在少数几家公司中心化(OpenAI、Anthropic、Google),这是由于训练所需的高端GPU集群的巨大开销。

这正是together.ai试图改变的,通过创建开放和去中心化的替代方案,来挑战现有的云系统(如AWS、Azure和Google Cloud),这对未来的商业和社会将是'至关重要的'。

随着企业界定义其生成式人工智能策略,他们正在寻找隐私、透明度、定制化和部署的便利性。目前的云服务,由于其封闭源模型和数据,无法满足他们的需求。”

华人学者携FlashAttention技术和Mamba模型加入团队任首席科学家

together.ai让AI模型训练快9倍,获NVIDIA参投1.025亿美元A轮融资

今年7月份,Tri Dao作为首席科学家加入公司团队,Tri Dao在斯坦福大学获得了计算机科学博士学位,导师是Christopher Ré和Stefano Ermon,他还即将成为普林斯顿大学的助理教授。他的研究曾获得2022年国际机器学习大会(ICML)杰出论文亚军奖。

Tri Dao还是FlashAttention v2的作者,这是一个领先且开源的大语言模型工具,可以加速大语言模型的训练和推理速度。

FlashAttention-2将大型语言模型(LLMs)的训练和微调速度提高了最多4倍,并在NVIDIA A100上实现了72%的模型FLOPs利用率。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier