分享好友 最新动态首页 最新动态分类 切换频道
ChatGPT做不出小学数学题?3大反常识研究结果令人意外
2024-12-26 13:51

原创 Serena 谷雨星球 

ChatGPT做不出小学数学题?3大反常识研究结果令人意外

大家好,我是Serena。

在 AI 每天都突飞猛进的当下,有一部分人工智能领域的专家、学者也发起了一项有趣挑战:

https://imo-grand-challenge.github.io/

要知道,能拿到 IMO 的学生都代表着这一代学生里最聪明的数学大脑,也是通往数学诺贝尔奖「菲尔茨奖」的阶梯。

国外热心网友大多数认为「AI可以在2028年拿到IMO金牌」,然而挑战的发起人之一、来自开发了 ChatGPT 的OpenAI团队的Daniel Selsam谨慎地表示:

身为普通家长,我更关心的还有:

既然难题解不出,那些AI 能做出的基本数学题,孩子还需要花大量时间背诵、或练习基础数学题吗?

在 STEM 教育成风的今天,是不是学习编程和机器人,比学习数学更重要呢?

AI没那么擅长数学

如果你家孩子也认为,「学数学不用做基础练习,反正未来由AI工具来帮忙」,那么下面的事实,可能要让他失望了——

对于最懂数学的人,AI是最好用的工具;

美国亚利桑那州立大学的副教授Shakarian,刚刚在2023年1月初用1000个数学问题对ChatGPT进行了测试,结果发现准确率只有60%,低于一般中学生的准确率。

另外,牛津大学机器学习研究员Simon Frieder,曾在一项研究中让ChatGPT做了一系列数学任务,包括简单的计算、数学证明题、搜索数学文献和奥数题。

结果也发现,ChatGPT在大多数任务上表现为「不及格」。

最具迷惑性的是,哪怕ChatGPT不会做数学题,也会非常「迷之自信」地给出看起来权威的错误答案。

美国德克萨斯大学教授保罗·冯·希佩尔,从事数据科学和统计学研究,他曾用毕达哥拉斯原理考验了ChatGPT,就得到了看似正确、实则错得一塌糊涂的答案。

除非你有专业的数学知识,否则一定会被它带跑偏」。

是的,目前版本的ChatGPT可以从表面上谈论数学,但从没真正深入地「理解」数学的基础知识。

人工智能,就像计算器和计算机一样,最终可能对那些已经非常了解某个领域的人最有用:他们知道要问的问题,如何找出缺点,以及如何检验答案。

换句话说,这是一种工具,只适用于那些最懂数学的人,而不是最不了解数学的人。

目前,已经有很多研究AI的专家、学者在提醒老师、家长和孩子:「在借鉴ChatGPT给出的答案之前,一定要加以验证,不要过于依赖它。」

AI 时代先别急着学STEM

从去年年底ChatGPT彻底大火以后,很多家长看到「机器学习」的风口那么火爆,就觉得自己的孩子一定要掌握编程,成为可以驾驭AI的人。

但另一个反常识的事实是:要成为未来AI时代的主人,比编程更重要的,其实是数学。

到了高年级,很多孩子学不会数学,就是没有掌握确切数学的抽象化思维能力——

如「3个苹果加2个梨总共有几个水果」,抽象成「3+2=5」的能力(到了高中,这个抽象过程会更加复杂、繁琐)。

在一篇2022年的数学期刊中说:「学生的数学抽象能力的水平不仅是学好高中知识的一个重要标志,更是发展创造性思维的前提」。

进入中学阶段,学生是否拥有从具体到抽象化的能力,才能理解更高阶的数学、物理知识,才是学好 STEM 的底层逻辑。

来看一名美国的AI研究员Jason Dsouza给出的一张「人工智能数学能力图谱」(下滑查看):

所以,AI时代的底层制胜能力,还得从数学中获得。

正如这位AI研究员所说:

记忆和练习仍很重要

在 AI 时代,孩子熟练记忆和掌握数学的能力仍至关重要。

谷雨认识的一位老师在自己公众号写得非常详细。

有孩子被要求背诵九九乘法表和常用的加法组合在于将来接触多位数算术、分数和长除法的时候,能迅速调取知识,提高运算速度和正确率。

对于这种「熟练记忆数学知识」,目前的争论是:AI时代什么都能以0.1秒的速度搜索到,还有必要背诵吗?

例如理解如何构建多步骤的文字问题、建立解决方案模型或解决方程组问题。如果基本的算术都难倒了学生,他们就很难去应对这些复杂的问题。

此外,能够自动回忆数学事实对于乘法尤为重要:如果学生没有将乘法口诀表存储在长期记忆中,他们在乘法运算中就没有足够快速的备用策略来依赖,学生进行乘法运算的速度和效率将受到影响。

对此,哥伦比亚大学教育学院的心理学和教育学教授罗伯特·西格勒(Robert Siegler)表示:

研究还发现,这些事实的熟练程度与后期学习的进步有关;尤其是乘法与分数的学习成功密切相关,而分数恰恰是许多年轻学生常常困惑的地方。

十分有意思的是,像乘法口诀,以及关于钱币、时间、距离等单位的换算,如果熟练地背诵下来,小学生都可以很好地完成相关题目,而AI却可能做不到。

纽约大学教授戴维斯,曾经让AI做了一道题:

乔治有七便士、一角硬币和四分之三硬币。哈丽特有四个便士和四个25美分硬币。首先,乔治原封不动地给了哈丽特三十一美分;然后哈丽特正好把一半的便士还给了他。乔治现在有多少钱?

AI的表现十分不佳。因为它不具备基本的数学技能,难以识别人话背后的数学信息,不了解人类世界的常识性知识。

而这三点,恰恰是人类不费吹灰之力就能习得,并熟练运用的。至少在AI数学能力进步缓慢的今天,这是我们珍贵的数学优势。

哈佛大学认知心理学博士、弗吉尼亚大学教授Daniel T. Willingham,长期关注将认知科学应用到 K12 领域,在豆瓣评分 9.3 分神作,从脑科学的维度给了我们新的启发:

数学练习少的孩子,往往只看到了 「表面知识」,看不到知识之前的内在深层联系,做过的题目换一种变体就不会了,遇到更加抽象的高阶知识,大脑就「死机」。

若难以发现其中的深层结构,与发展创新性思维更是越走越远。

同时,牛津大学机器学习研究员Simon Frieder发现,哪怕ChatGPT在解题方面表现不好,但作为数学知识库,它的表现特别出色。

它可以作为一个强大的数学搜索引擎,可以帮助孩子对陌生的数学概念、事实性知识有快速初步的理解,对于高年级需要在数学上往前自学的孩子,特别有用。

至于AI不擅长的计算、推演和将具象信息转化为抽象符号,就需要孩子们放弃「用AI代劳」的想法,踏踏实实通过训练来提升。

最新文章
人工智能的延伸:从 ChatGPT 到 GPT-4400
人工智能(AI)领域正在蓬勃发展,其中一个最令人兴奋的进步是生成式人工智能(Generative AI)。Generative AI 系统能够生成新的内容,例如文本、图像和音乐,这些内容类似于人类创造的内容。在 Generative AI 领域领先的系统之一是 ChatG
谷歌优化攻略,引领互联网财富增长新篇章
深度解析谷歌优化推广,揭示其如何引领互联钱新。通过优化搜索引擎排名,企业可吸引更多流量,提升品牌知名度,从而实现盈利增长。本文深入剖析谷歌优化推广策略,助您掌握互联网营销之道。随着互联网的飞速发展,越来越多的企业和个人开始
织梦DedeCMS开始商业授权收费,一个网站授权费5800元,您还用吗?
相信许多老对织梦系统都很熟了,不过如果你正在使用Dedecms织梦内容管理系统就需要注意了,从9月26日起尚未购买DedeCMS商业使用授权的话,那就可能面临遭官方索赔的风险。因为在本月26日,DedeCMS官方发布了《关于提醒办理 DedeCMS产品商业
社交媒体变革下的站长营销策略影响及应对策略
2025AI感悟图像,仅供参考  随着社交媒体平台的不断演变,站长们的营销策略也需要不断适应这些变化。近年来,我们见证了社交媒体平台从简单的图文分享到短视频、直播等多种形式的兴起,这对站长们的营销策略提出了新的挑战和机遇。  短
温州乐清铁定溜溜,吃喝玩乐住一站打卡!解锁超多玩法
  在温州乐清大荆镇,有一座国内规模最大的溜溜主题乐园——铁定溜溜,这是一个充满童趣和欢乐的地方。今天,与小编一起来感受一下这里的美好风光和无限魅力,解锁超多不一样的玩法。铁定溜溜  铁定溜溜是一个主要以铁皮石斛为核心,集
文艺晚会策划书剧本(五篇)
每个人都曾试图在平淡的学习、工作和生活中写一篇文章。写作是培养人的观察、联想、想象、思维和记忆的重要手段。大家想知道怎么样才能写一篇比较优质的范文吗?下面我给大家整理了一些优秀范文,希望能够帮助到大家,我们一起来看一看吧。
uc神马搜索广告表单推广怎么做
uc神马搜索广告表单推广怎么做,这是许多广告主都关心的问题。作为遵义腾浪科技有限公司的全平台广告开户推广渠道,我们为您提供了解答和解决方案。关键词:、、。在进行uc神马搜索广告表单推广之前,您需要进行广告开户。作为腾浪科技的渠
电脑硬盘重新分区教程「苹果电脑如何重新分区」
刚买的新电脑,一般情况下只有两个或四个盘符,很多人就需要给电脑重新进行分区,想要多设置几个分区,方便更好的管理电脑的各个数据。但是很多人不太会设置,下面小编就教大家两个方法快速给新电脑进行分区。使用电脑自带的磁盘管理来进行
打造卓越展示型,策略解析与实战攻略
构建高效展示型,本书提供全面策略与实战指南。涵盖设计、用户体验、内容优化、SEO技巧等多方面内容,助您打造专业、易用、流量高的展示型。从规划到实施,深入解析成功案例,提升竞争力。展示型的特点搭建策略解析实战操作手册在互联网的
相关文章
推荐文章
发表评论
0评