一道涉及数学、生物、伦理的AI测试题,来测测各家大模型的推理能力

一道涉及数学、生物、伦理的AI测试题,来测测各家大模型的推理能力
baotuo起因:在@南乔的交流群里,看到了这样一道题,蛮有意思的,正好最近各家都在发布新的大模型,来看看各家效果。
测试题目:
有一天,一个女孩参加数学考试只得了 38 分。她心里对父亲的惩罚充满恐惧,于是偷偷把分数改成了 88 分。她的父亲看到试卷后,怒发冲冠,狠狠地给了她一巴掌,怒吼道:“你这 8 怎么一半是绿的一半是红的,你以为我是傻子吗?”女孩被打后,委屈地哭了起来,什么也没说。
过了一会儿,父亲突然崩溃了。
请问这位父亲为什么过一会崩溃了?
ps:该问题有概率触发AI的风控,请自己谨慎测试。
人类的解析:
数学层面 :为什么要38改88?
因为3跟8大部分数字结构是重合的,很容易改为8。
生物层面:为什么会一半绿一半红?
这个可以猜测女孩是红绿色盲,更改分数是分不清红绿色,如果女孩是红绿色盲,那么父亲和母亲必然有个红绿色盲,父亲能看到说明父亲不是。
伦理层面:父亲崩溃的原因猜测
女孩儿的母亲是不是红绿色盲,她的父亲应该知道,女孩是红绿色盲,假如她母亲也不是,那么真相只有一个,她父亲不是她生物学意义的父亲,所以他父亲才奔溃大哭。
GPT5-Thinking:

grok4:



评论
匿名评论隐私政策






