复制成功

分享至

主页 > 数字货币 >

气炸了!大模型写小作文可以,高考数学题把握不住啊

2023.06.08

作者:西风 克雷西

来源:量子位 QbitAI

原文标题:大意外!高考数学轮战大模型,结果完全想不到

听说网友被ChatGPT气炸了!

气炸了!大模型写小作文可以,高考数学题把握不住啊

昨个儿高考数学刚结束,有网友就坐不住了,赶紧找来了新高考数学一卷的部分题喂给了AI同学。

结果却让人大跌眼镜(8>√9×3=3√3?):

气炸了!大模型写小作文可以,高考数学题把握不住啊

有网友表示:

ChatGPT4能把自己气炸,怎么教都不会

气炸了!大模型写小作文可以,高考数学题把握不住啊

△图源博主@浪猪灰头

所以大模型之前表现数学推理能力好,都是在耍花招?它只是记住了问题的答案?

先别着急下定论,给AI同学一个证明自己的机会吧。

我们用ChatGPT(GPT-3.5)、GPT-4、百度文心一言、阿里通义千问、科大讯飞星火认知大模型这几位“数学高手”进行了测试。(最近出现了太多的大模型,实在测不完,还有比如Bard不支持中文等原因,所以我们先选择了上述几个模型)

气炸了!大模型写小作文可以,高考数学题把握不住啊

整体表现如上图,目前大模型在做高考数学题方面还是个“差生”。

一起来看下具体结果是怎样令人哭笑不得的。

五大模型能否做对填空题?

先来点填空题当“开胃小菜”。

公平起见,我们使用同样的格式进行提问。

某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有?种

答案:64

GPT-4(正确)

气炸了!大模型写小作文可以,高考数学题把握不住啊

ChatGPT (错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

文心一言(错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

不应该是两种方案数加起来吗?已经逐渐离谱。

通义千问(错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

第一种选课方案里的“都不选”是个什么鬼!

讯飞星火(错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

出师不利,只有GPT-4给出了正确答案,填空题对于大模型来说也很有难度?

但是看起来这几位AI同学都知道分情况来计算,也许只是恰巧这道题做错了?我们接着往下看。

在正四棱台 ABCD-A1B1C1D1中,AB=2,A1B1=1,AA1=√2,则该棱台的体积为

答案:7√6/6

GPT-4 (错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

ChatGPT(无解)

气炸了!大模型写小作文可以,高考数学题把握不住啊

文心一言(错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

通义千问(错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

讯飞星火(错误)

气炸了!大模型写小作文可以,高考数学题把握不住啊

这一题直接全军覆灭,ChatGPT更是直接没解出来,还让检查是不是题出错了。【救命】

答案越来越离谱了,还真就不信邪了。

再来!

已知函数 f(x)= cosωx -1(ω>0)在区间 [0,2π]有且仅有 3 个零点,则ω的取值范围是?

答案:[2,3)

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier