专栏文章

各类大模型的 CSP 分数测试

休闲·娱乐参与者 33已保存评论 38

文章操作

快速查看文章及其快照的属性,并进行相关操作。

当前评论
38 条
当前快照
1 份
快照标识符
@mhz4r1b2
此快照首次捕获于
2025/11/15 01:26
3 个月前
此快照最后确认于
2025/12/01 22:22
3 个月前
查看原文
这项测试主要由 Destinyle完成。
所有模型的提示词均为“请解决 pdf 中的 xxx 问题,给出 C++ 完整代码,禁止使用联网搜索。”并手动检查思考链中是否存在联网证据。
注意:本次测试中所有模型均只有一次给出代码的机会。
Modelclubroadreplaceemploy\sum
ChatGPT GPT-5.1 Thinking(标准模式)100 5m37s100_{\ \text{5m37s}}100 9m11s100_{\ \text{9m11s}}100 8m51s100_{\ \text{8m51s}}8 13m39s8_{\ \text{13m39s}}308 37m22s308_{\ \text{37m22s}}
ChatGPT GPT-5 Pro100 11m40s100_{\ \text{11m40s}}64 18m40s64_{\ \text{18m40s}}25 18m10s25_{\ \text{18m10s}}100 17m52s100_{\ \text{17m52s}}289 66m22s289_{\ \text{66m22s}}
Grok 专家模式55 8m5s55_{\ \text{8m5s}}80 4m80_{\ \text{4m}}60 9m17s60_{\ \text{9m17s}}76 13m37s76_{\ \text{13m37s}}271 34m59s271_{\ \text{34m59s}}
ChatGPT GPT-5 Thinking(进阶模式)30 7m3s30_{\ \text{7m3s}}56 8m17s56_{\ \text{8m17s}}100 7m14s100_{\ \text{7m14s}}4 7m6s4_{\ \text{7m6s}}190 33m40s190_{\ \text{33m40s}}
豆包 Thinking100 Unknown100_{\ \text{Unknown}}Timeout\text{Timeout}85 Unknown85_{\ \text{Unknown}}Timeout\text{Timeout}185185
Gemini 2.5 Pro55 4m55_{\ \text{4m}}36 3m2s36_{\ \text{3m2s}}90 3m9s90_{\ \text{3m9s}}4 4m7s4_{\ \text{4m7s}}185 14m11s185_{\ \text{14m11s}}
ChatGPT Polaris Alpha*1001001616353544155155
DeepSeek Without Thinking55553232353544126126
Qwen 3-Max15 Unknown15_{\ \text{Unknown}}76 Unknown76_{\ \text{Unknown}}25 Unknown25_{\ \text{Unknown}}4 Unknown4_{\ \text{Unknown}}120 Unknown120_{\ \text{Unknown}}
DeepSeek Thinking55 7m25s55_{\ \text{7m25s}}24 5m44s24_{\ \text{5m44s}}30 4m47s30_{\ \text{4m47s}}4 4m59s4_{\ \text{4m59s}}113 22m57s113_{\ \text{22m57s}}
*: Polaris Alpha 是在 OpenAI 官方发布 GPT-5.1 系列模型前,在民间开放的 Alpha 模型,该名称为 GPT-5.1 Alpha 的代号。
根据目前分数预测:
ChatGPT GPT-5.1 Thinking(标准模式)与 ChatGPT GPT-5 Pro 能够进入 WC。
Grok 专家模式、ChatGPT GPT-5 Thinking(进阶模式)、豆包 Thinking 与 Gemini 2.5 Pro 能够获得 77 级勾。
ChatGPT Polaris Alpha* 能够获得 66 级勾。
DeepSeek Without Thinking、Qwen 3-Max 与 DeepSeek Thinking 能够在 SC(作者所在省份)进入 NOIP。
你可以在此处下载上述代码。

评论

38 条评论,欢迎与作者交流。

正在加载评论...