社区讨论

抛开题目本身和OJ,这种题能当做nlp做吗

题目总版参与者 3已保存回复 3

讨论操作

快速查看讨论及其快照的属性,并进行相关操作。

当前回复
3 条
当前快照
1 份
快照标识符
@m1151el2
此快照首次捕获于
2024/09/14 03:55
去年
此快照最后确认于
2025/11/04 21:16
4 个月前
查看原帖
比如 P1039
如果不是出现在OJ上,不看题目说明,单纯看到输入输出样例里那些东西就觉得像是某个nlp(自然语言处理)的数据集的一部分(你可以去看看隔壁的kaggle)
  1. 用脚本多造亿些数据
  2. 从题解栏里面随便找个AC的代码生成答案,加入文件读写保存为csv文件
  3. 这些内容汇总起来拆分成训练集、测试集和验证集
  4. 在python里用keras或者sklearn啥的训练一个模型。要做好准备,训练上三天三夜都是有可能的
大体上就是这样
nlp里面多数情况下预处理阶段就会把所有的标点符号丢弃,所有的大写转小写
OJ上因为大小写或者缺少空格/缺少标点符号或者类似的原因导致WA的比比皆是(常见于UVA系列的题)
有条件的话把这道题所有的checkpoint全部下载到本地看看刚刚训练的模型能拿到多少分

回复

3 条回复,欢迎继续交流。

正在加载回复...