Skip to content

模型微调与数据标注问题 #14536

Closed Answered by GreatV
whitewolf666 asked this question in Q&A
Discussion options

You must be logged in to vote

在微调 en_PP-OCRv4_rec 模型以增强其对手写数字的识别能力时,数据标注和数据集设计至关重要。以下是相关建议:

数据标注

  1. 同时包含手写字体和正常字体的图片

    • 建议标注所有文本,包括手写字体和正常字体。原因在于,OCR 模型需要学习区分不同字体(手写和正常字体)的特征。如果只标注手写部分,可能会导致模型在混合场景中无法正确处理未标注的部分。
  2. 标注策略

    • 如果图片中手写字体是主要关注对象,可以在标注中为手写字体分配更高的权重(通过数据增强或采样策略实现)。
    • 标注的格式应尽可能清晰和规范,确保模型能准确理解输入与输出的对应关系。

数据集设计

  1. 添加额外数据

    • 建议增加包含正常数字和字符的样本。原因如下:
      • 如果训练集中只包含手写字体样本,模型可能会过拟合于手写场景,导致对正常字体的识别能力下降。
      • 通过包括正常字体样本,模型可以学习到丰富的特征,提升对混合场景的处理能力。
  2. 数据平衡

    • 确保训练集中手写字体和正常字体的样本比例适当。如果手写字体是主要目标,可以适当增加手写字体样本的比例。
  3. 数据增强

    • 对于手写字体,可以通过旋转、缩放、噪声添加等方式进行数据增强,模拟更多样化的手写场景。
    • 同时,对正常字体的样本也可以进行常规的数据增强操作。

微调训练的注意事项

  1. 预训练模型的选择

    • 使用 en_PP-OCRv4_rec 的预训练模型作为初始化权重,这样能加速收敛并提升效果。
  2. 学习率调整

    • 微调时建议使用较小的学习率,以避免破坏预训练权重。
  3. 评估策略

    • 单独评估手写字体和正常字体的性能,确保模型在两类…

Replies: 1 comment

Comment options

You must be logged in to vote
0 replies
Answer selected by whitewolf666
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Category
Q&A
Labels
None yet
2 participants