OpenAI发布最新旗舰级模型GPT4o，ChatGPT迈入人机交互新阶段

2024.05.14

博链财经BroadChain获悉，5月14日，OpenAI 发布最新旗舰级模型 GPT-4o，可以实时推理音频、视觉和文本，主打概念为拟人化、超自然、超低时延的个人语音交互助理。

根据 OpenAI 官方网站及 X 平台官方账号相关信息，GPT4o 中的 o 代表 Omni（全面），是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入，并支持生成任意组合的文本、音频和图像输出。

它可以在 232 毫秒内响应音频输入，平均 320 毫秒，与对话中人类反应时间相似。

在英语和代码方面，它与 GPT-4 Turbo 性能相当，在非英语语言文本上有显著改进，同时 API 速度更快且成本便宜 50%。

与现有模型相比，GPT-4o 在视觉和音频理解方面表现特别出色。

文本和图像输入将在 API 和 ChatGPT 中推出，语音和视频输入将在未来几周内推出。

免责声明:数字资产交易涉及重大风险，本资料不应作为投资决策依据，亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考，不构成任何投资建议，用户一切投资行为与本站无关。

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐