模型微调与数据标注问题 #14536
模型微调与数据标注问题
#14536
-
您好,我们的需求是给定一张包含正常数字和手写数字的图片,模型能够对其进行识别。我们尝试了en_PP-OCRv4_rec,其识别手写数字的能力似乎不是很理想。 |
Beta Was this translation helpful? Give feedback.
Answered by
GreatV
Jan 13, 2025
Replies: 1 comment
-
在微调 数据标注
数据集设计
微调训练的注意事项
总结在数据标注时,建议标注图片中所有的文本(包括手写字体和正常字体)。同时,训练数据集需要包含正常字体的样本,以确保模型在混合场景中的表现。通过微调训练,结合数据增强和合适的训练策略,可以显著提升 Response generated by feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
0 replies
Answer selected by
whitewolf666
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
在微调
en_PP-OCRv4_rec
模型以增强其对手写数字的识别能力时,数据标注和数据集设计至关重要。以下是相关建议:数据标注
同时包含手写字体和正常字体的图片:
标注策略:
数据集设计
添加额外数据:
数据平衡:
数据增强:
微调训练的注意事项
预训练模型的选择:
en_PP-OCRv4_rec
的预训练模型作为初始化权重,这样能加速收敛并提升效果。学习率调整:
评估策略: