首个AI高考全卷评测结果发布:最高分303,数学全不及格
首个AI高考全卷评测结果发布:最高分303,数学全不及格
钛媒体 App 6 月 19 日消息,上海人工智能实验室旗下司南评测体系 OpenCompass 选取了 7 个大模型进行高考 " 语数外 " 全卷能力测试。OpenCompass 发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为 420 分,此次高考测试结果显示,阿里通义千问 2-72B 排名第一,为 303 分,OpenAI 的 GPT-4o 排名第二,得分 296 分,上海人工智能实验室的书生 · 浦语 2.0 排名第三,三个大模型的得分率均超过 70%。来自法国大模型初创公司的 Mistral 排名末尾。从结果来看,大模型的语文、英语考试水平普遍不错,但数学都不及格,最高分也只有 75 分。
-
- 一直“被暴跌”的李佳琦
-
2024-06-24 06:43:39
-
- 证监会:鼓励证券公司积极开展并购重组业务
-
2024-06-24 06:41:23
-
- 欧洲杯比赛前夕 德国男子挥锤持汽油弹遭警察枪击
-
2024-06-24 06:39:07
-
- 女子存650元硬币被银行柜员拒绝,大堂经理出面帮存
-
2024-06-24 06:36:50
-
- 中东冲突或再度升级!以色列警告黎巴嫩“全面战争”前景
-
2024-06-23 19:25:07
-
- 海南万宁通报“游客称潜水遭弃海中2小时游回岸边”:警方已介入调查
-
2024-06-23 19:22:51
-
- 一周死亡38例,600多人住院!台湾新冠重症及死亡病例大幅增加
-
2024-06-23 19:20:34
-
- 6月LPR延续“按兵不动” 机构:后续存下调空间
-
2024-06-23 19:18:18
-
- 英媒:中国针对欧盟猪肉行业的最新举措,精准击中欧盟软肋
-
2024-06-23 19:16:02
-
- 连接广深涉及6条延伸线 东莞地铁二期建设规划调整
-
2024-06-23 19:13:47
-
- 一件快递牵出贩毒大案,19人落网
-
2024-06-23 19:11:31
-
- 预售 21.99 万元起,蔚来乐道 L60 车型被曝 9 月 10 日发布上市
-
2024-06-23 19:09:15
-
- 网红咖啡变成“暴力咖啡”:该关注的不只有“情绪失控”
-
2024-06-23 19:06:59
-
- 韩江洪水已全线退至警戒水位以下
-
2024-06-23 19:04:43
-
- 单瓶跌幅超400元,茅台不香了?
-
2024-06-23 02:56:42
-
- 欧洲杯的「特供中文广告」,背后是门大生意
-
2024-06-23 02:54:26
-
- 特大洪水,桂林被倒灌!景点“六匹马”被淹到看不见,新娘坐消防车后转乘小船
-
2024-06-23 02:52:10
-
- 硬件搭上AI,字节美团相中万亿新赛道
-
2024-06-23 02:49:53
-
- 一再错过的三星 切入GPU能曲线救国吗?
-
2024-06-23 02:47:38
-
- 便利店的冰杯杀疯了!冰杯怎么就成了一门好生意?
-
2024-06-23 02:45:22