这道小学数学题,AI竟集体答错
⭐发布日期:2024年10月09日 | 来源:新浪娱乐
【新澳门资料大全正版资料?奥利奥】 |
【澳门一肖一码100精准2024】 |
【澳门今晚开什么奖】 | 【澳门4499资料大全】 | 【澳门跑狗图网站】 | 【2024年新奥门王中王结果】 | 【2024年新澳四期必出三期】 | 【2024澳门一肖一码配套成龙】 | 【澳门六开彩精准资料大全】 | 【台岛周边演习最新照片发布】 |
【六盒大全经典全年资料2024年版】 | 【马会澳门正版资料查询】 | 【澳门精准免费码资料大全】 | 【香港二四六免费资料大全一一】 | 【新澳门资料大全免费】 | 【香港宝典大全资料大全】 | 【2024澳门管家婆生肖图】 | 【新澳今天最新资料】 |
7月13日,最新一期的《歌手》公布排名:孙楠得票13.8%,外国歌手香缇莫得票13.11%。这引发了一些网友对排名的质疑。
有网友认为13.11%大于13.8%,因此,香缇莫的得票率比孙楠高。
随后,关于13.8%和13.11%大小比较,一度成为了网络上的热门话题。
这样一道简单的数学题,还难倒了不少大模型。
“9.11大于9.9”
这一类数学题,AI有时答对有时答错
有媒体报道,ChatGPT等国内外AI大模型,在回答这道数学题时出现了胡说八道的现象。
橙柿记者们也去提问了几家AI大模型,结果显示,有不少AI模型是答错的,还有一些AI在答题时出现了时对时错的不稳定情况。
两位记者提问了kimi,发现它时对时错,反应“冷淡”。
但在回答另一位记者时,却举例分析,让结果看起来更加直观、更好理解。
另外,记者还询问了文心一言、讯飞星火等AI模型,大部分的AI回答正确并给出了详细的答题过程。
会翻车但能“自我修正”
据南方都市报报道,AI模型智谱清言也曾给出过错误答案。
智谱清言称,13.11在百分位上比13.80大。
智谱清言是通过比较小数部分得出错误结论,称“13.11的百分位是1,而13.80(即13.8)的百分位是0。在这种情况下,1大于0。”“简而言之,13.11实际上等于13.80+0.01+0.01,这使得它比13.80(即13.8)大。”
当橙柿记者向它提问时却发现,智谱清言已经能得出正确的答案,并试图分析网络上有人得出错误答案的原因。
在比较13.8%和13.11%时,13.8%是更大的数值。
这是因为当比较两个百分数时,我们实际上是在比较它们所代表的小数。13.8%相当于0.138,而13.11%相当于0.1311。显然,0.138大于0.1311,因此13.8%大于13.11%。这个话题似乎在网络上引起了广泛的讨论,可能是因为有些人错误地将13.8%理解为13.08%,从而得出了错误的结论。
从以上这些结果中,我们发现AI模型在回答这样一道简单的数学问题时,也存在一些错误和不稳定性。
做数学题,AI会出现“幻觉”
据橙柿此前报道,今年的阿里全球数学竞赛中,有AI选手参赛但全军覆没。
AI数学成绩不佳,核心是因为基础模型的数学能力有限。虽然在面对解答题和证明题时,AI可以通过知识检索等方式拿到基础分,但一旦涉及到后续的深入分析,AI就开始出现“知识幻觉”。尤其是在面临选择题时,多数AI出现了“蒙题”的现象。
哈尔滨工业大学和华为的研究团队发表的综述论文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以应对复杂推理的情况。
另据南方都市报道,有技术专家分析,在人们看来,这是一道小学生的数学算术题,但大模型不一定这样认为,它更经常见到这些数字是包含在软件版本号、股票、基金或者汇率等信息里,它们出现时跟数字大小本身没有关联。而大模型看到这样一组数字,意识不到应该做双精度浮点运算。
还有业内人士提出了一种解释称,这是大模型在输入词和标点向量化排序时,没有把顺序或者关联逻辑弄对,忽略了小数点也是数字的一部分。
你去提问过AI模型吗?都得到了一些什么答案?来评论区分享一下吧!
来源:橙柿互动·都市快报综合报道
【2024澳门天天开好彩大全免费】 【新澳天天开奖资料大全最新】 |
【2024年天天开好彩资料】 【新澳天天开奖资料大全最新54期】 |
【2024澳门天天开好彩大全53期】 【澳门天天开彩期期精准】 |
【2024全年资料免费大全】 【新澳天天开奖资料大全】 |
【澳门内部最精准免费资料】 【2024澳门天天开好彩大全】 |
【2024年新奥门天天开彩免费资料】 【新澳2024今晚开奖资料】 【2024年澳门天天彩免费资料】 |
发表评论
张玉
6秒前:1311。
IP:91.21.2.*
Calum
7秒前:11实际上等于13.
IP:66.94.1.*
Caylee
6秒前:01,这使得它比13.
IP:10.39.7.*