- N +

563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34原标题:563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

导读:

各位村民好我是村长讨论这个话题的时候一定会得罪很多人但个人觉得不得不说近一两年来副业圈网赚圈圈等已经从简单圈子费课程费上升到了几万块钱的私快科技月日消息在最近举办的中来自江苏省...

各位村民好,我是村长。讨论这个话题的时候,一定会得罪很多人,但个人觉得不得不说。近一两年来,副业圈、网赚圈、IP圈等,已经从简单圈子费、课程费上升到了几万块钱的私

快科技6月16日消息,在最近举办的中,来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛,还以全球排名12的成绩成为了赛事历史上首个进入决赛的中专生。

不仅如此,今年的阿里数赛还首次开放了,共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。

563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34

最终AI队伍的平均分为18分,这一成绩已经接近人类选手的平均水平。但最高得分却仅为34分,与人类选手的最高分113分相差甚远,并且AI队伍在决赛中无一入围。

AI队伍中最高分由上海建平中学的涂津豪个人推出的AI方案获得,他采用了一种让多个大模型进行自问自答自验证”的方法,以寻求问题的最优解。

而西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分的成绩位列AI挑战赛的亚军和季军。

尽管AI在中的表现显示出了一定的潜力,但专家分析指出,现有的大语言模型在完成复杂推理和严谨思考方面仍存在局限。

AI在逻辑推理能力和证明题的得分上表现不佳,这表明在深层次逻辑推理和创新思维方面,人类选手依然保持着明显的优势。

返回列表
上一篇:
下一篇: