社区讨论
洛谷 Dataset 代码征集公告
站务版参与者 2,114已保存回复 2,263
讨论操作
快速查看讨论及其快照的属性,并进行相关操作。
- 当前回复
- 2,230 条
- 当前快照
- 7 份
- 快照标识符
- @lxuj8mo1
- 此快照首次捕获于
- 2024/06/25 22:59 2 年前
- 此快照最后确认于
- 2025/08/22 10:12 6 个月前
update:已经收集到了足够的用户授权。我们将逐步整理代码。
为了推动算法竞赛领域的学术研究和 AI 模型的发展,洛谷决定开放一个数据集项目。该项目旨在挑选一些经典的算法竞赛题目,公开题面和测试数据,并提供大量用户提交的代码。这个数据集将作为 LLM(大型语言模型)的训练和评估的 testbench,面向学术界开放使用。
我们诚挚地邀请各位洛谷用户成为我们的志愿者,共同参与这个项目的建设。
我们需要什么?
我们需要您授权洛谷整理您提交的部分题目的代码(C++ 和 Python),包括这些题目:
-
和其他的一些经典题目,还在挑选
您只需要在本贴回复任意内容,则视为授权提供您的代码。回帖后 5 分钟内,你可以选择删除回复,超过 5 分钟则无法撤回。
等一段时间后,我们会收集经过授权的用户代码,经过整理、脱敏后公开。
公开的数据集会有哪些内容
- 题目的题面(中文/英语)和测试数据
- 用户提供的代码
- 评测记录表格(经过离散化后的用户ID、题目编号、评测状态)
数据集公布时,会展示贡献者的用户名,以示感谢(也可以选择匿名)。
我们相信,这个数据集将成为推动算法竞赛和 AI 领域发展的重要资源。感谢大家的贡献。
回复
共 2,263 条回复,欢迎继续交流。
正在加载回复...