|-- my_data
| -- zh_CN
| -- train
| -- 帕拉斯.jpg
| -- 幽灵鲨.jpg
| -- ......
| -- test
| -- 斯卡蒂.jpg
| -- 史尔特尔.jpg
| -- ......
将你额外的训练集和测试集放到 train
/ test
文件夹里,会递归遍历文件夹内所有图片文件
请注意目前主要是识别模型的训练,不包含检测,所以放进来的数据集是需要裁剪好的(即一张图中仅有文字,要尽量精确的裁剪出来)
然后文件名要就是图里字的内容,例如:帕拉斯.jpg