当前位置: 首页>推荐>篮球推荐

    高考AI答题系列|今年数学到底有多难?大模型:我也不太会啊

    发布时间:2024-07-09   阅读:  次

    大模型,数学,高考,立体几何


    出品|网易科技《态度》栏目

    作者|薛世轩

    编辑|丁广胜

    如果说高考语文作文题所考察的文字功底是各家大模型的入门基本功的话,那么数学的难度Level就更考验大模型的图像识别与分析能力了。毕竟曲线题、导数题、函数题、几何题可不是什么善茬。(这可能也是为什么很少有人在网上讨论数学题的原因了)


    因此,我们测试了GPT-4o、kimi、文心一言、讯飞星火大模型、百小应、通义千问、360大模型、豆包这8款目前市面上主流的几款大模型,看看它们遇到“硬茬”时又会作何表现呢?

    为了更全面的考察大模型的综合性能,我们分别选取了数学I卷的一道立体几何题和一道函数题,以考察大模型的空间理解能力和逻辑推理能力,以下为具体考题:

    立体几何题:


    函数题:


    (下文各图左侧为立体几何题,右侧为函数题)

    GPT-4o


    Kimi


    文心一言


    讯飞星火大模型


    百小应


    通义千问


    360智脑


    豆包


    以上就是所有8款大模型在作答今年高考数学I卷的表现,可以发现,尽管大模型们在今年历经多次迭代,但在本次测试中的表现并不尽如人意,且关于同一道题目所给出的答案也不尽相同。

    高考AI答题系列|今年数学到底有多难?大模型:我也不太会啊



    高考AI答题系列|今年数学到底有多难?大模型:我也不太会啊

    除此之外,GPT-4O则使用全英文答题;通义千问在作答函数题时出现了“bug”现象,对同一函数式开始无限循环;豆包甚至由于tokens用尽出现了无法进行完整作答;文心一言也对题干信息理解错误……

    由此可见,不仅是考生们直呼今年数学“太难了”“裂开了”,就连大模型们的发挥也不如预期中的优秀。

    但无论今天考的怎样,高考第一天已经结束,考生们要做的就是放松心情,全力准备明天的考试,网易科技也祝考生们金榜题名!

    延伸阅读 字节跳动计划在马来西亚投资21亿美元建区域人工智能中心 特斯拉中国上线百度地图V20 国产“星链终端”来了 无人区也能上网 2.98万值吗?
    高考AI答题系列|今年数学到底有多难?大模型:我也不太会啊
    大模型,数学,高考,立体几何

    上一篇 : 多家媒体:佩德里左膝内侧韧带受伤,本届欧洲杯报销

    下一篇 : 高迪社媒发文庆祝胜利:好事连连,赛季第9胜_1

最新直播 / Match
推荐录像 / Video

网站首页 | 网站地图 | Sitemap

JRS低调看直播是一个业界专业的NBA直播网站,24小时实时更新最新比赛信息,主要提供高清NBA直播、足球直播、英超直播,JRS直播以最全最高清信号源,让您免费畅享体育赛事。

JRS低调看直播所有直播信号和视频录像均由用户收集或从搜索引擎搜索整理获得,如有侵犯您的权益请通知我们,我们会第一时间处理,谢谢。

Copyright © 2023 JRS低调看直播. All Rights Reserved 版权所有 粤ICP备17058876号-1

足球 篮球 录像 新闻