复制成功

分享至

主页 > 数字货币 >

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

2024.01.31

文章来源:量子位

图片来源:由无界AI生成 图片来源:由无界AI生成

“2024年上半年对标GPT-4”,这是23年科大讯飞全球1024开发者节现场给出的承诺。

今天,2024刚开年,讯飞星火就迎来重大升级:

讯飞星火V3.5整体接近GPT-4 Turbo; 数学、语言理解、语音交互能力超过GPT-4 Turbo; 代码达到GPT-4 Turbo 96%; 多模态达到GPT-4V 91%。 实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

尤其在语音交互功能上,超逼真的真人语音生成,直接让线上网友惊叹三连:

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来


实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

还有更多实用功能,比如现场几十秒的时间生成22页PPT!这速度,很快啊……

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

而围绕着这个大模型底座,科大讯飞还有一揽子产品和场景应用输出。

国产首个语音大模型 星火开源大模型“星火开源-13B” 讯飞翻译机升级 面向教育行业的智慧黑板
……

从基础模型到应用场景,下面一起来看。

讯飞星火V3.5底座能力升级

讯飞星火V3.5除了七大能力全面提升,整体能力接近GPT-4,还特别在语言理解、数学等能力上实现超越。

尤其对中文的理解更占优势,具体数据对比如下:

语言理解、数学能力超过GPT-4 Turbo; 代码打到GPT-4 Turbo 96%; 多模态理解达到GPT-4V 91%

……

如果看数据图表还不够直观,我们也提前实测了一番。

就拿此次网友最为称道,也是本次更新最大的亮点——全语音交互,不是语音消息那样一条一条的,而是像打电话一样实时交互。

星火这一波应对得怎么样,算不算得上高情商?

要注意视频没有做加速处理,讯飞星火V3.5的语音响应就是这么快,与ChatGPT的语音交互相比,省去了大量“等待AI思考”这个环节,整个对话过程更流畅。

“聆飞逸”、“聆小玥”分别对应男女声两种音色,可自由切换。在音色自然,还像人一样时不时有停顿、“嗯……”等语气词。

在有感情,拟人度等方面,对比ChatGPT的“Ember”、“Juniper”音色也不遑多让。

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

在交互模式上还设计了“一键打断”功能,避免AI生成在一轮对话中内容过长。

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

打断后,可继续提问下一个问题,也可以直接“挂断”语音,切回到文字模式,看到刚刚整个对话过程的文字版。

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

除此之外,在其他能力表现上,我们先用一个经典挖坑题来考验。

结果讯飞星火V3.5不但回答了最后的问题,还没有被前面无关的信息绕进去,每一个不合理之处都被揪出来了。

做到这一点不仅需要推理问题中的文字逻辑,还要结合大模型在训练阶段学到的关于现实世界的知识。

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

对比GPT-4,除了格式不同,推理能力、知识水平可以算是在一个level了。

另外也可以推测,由于要兼顾语音表现,讯飞星火的回答总是一串连贯的句子,而GPT-4更注重视觉排版。

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

时效性方面,提问最新网络流行梗,星火也是能跟得上潮流的。

实测讯飞星火V3.5:全语音交互比肩GPT-4!超逼真唠嗑让你根本停不下来

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier