Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Slanet_plus微调后bbox解码有错误 #2549

Open
4 tasks
flow3rdown opened this issue Nov 25, 2024 · 13 comments
Open
4 tasks

Slanet_plus微调后bbox解码有错误 #2549

flow3rdown opened this issue Nov 25, 2024 · 13 comments
Assignees
Labels
bug Something isn't working ocr

Comments

@flow3rdown
Copy link

Checklist:

描述问题

使用原生的Slanet_plus进行推理结果是正确的,但是用自己微调的slanet_plus模型推理时需要将bbox_decode(

def _bbox_decode(self, bbox, padding_shape, ori_shape):
)处的设置改为slanet的形式,是我哪里的配置的有问题吗?

训练脚本:

python main.py -c paddlex/configs/table_recognition/SLANet_plus.yaml,yaml里面的model的名字就是SLANet_plus

复现

  1. 您是否已经正常运行我们提供的教程

  2. 您是否在教程的基础上修改代码内容?还请您提供运行的代码

  3. 您使用的数据集是?

  4. 请提供您出现的报错信息及相关log

环境

  1. 请提供您使用的PaddlePaddle和PaddleX的版本号
    paddlefsl 1.1.0
    paddlenlp 2.8.0.post0
    paddleocr 0.1.0.dev1+geaef336
    paddlepaddle-gpu 3.0.0b1
    paddlex 3.0.0b1
  2. 请提供您使用的操作系统信息,如Linux/Windows/MacOS
    Linux
  3. 请问您使用的Python版本是?
    3.10.6
  4. 请问您使用的CUDA/cuDNN的版本号是?
    12.1
@flow3rdown
Copy link
Author

#2493 之前提过一个issue,但是被close掉了,如果问题已经解决的话可以忽略这个issue,如果没有解决的话烦请不要close,或者请PaddleX的大佬们可以声明一下暂时不支持Slanet_plus的微调?以免别人尝试之后浪费训练资源和时间。

@zhangyubo0722
Copy link
Collaborator

这个问题会尽快修复

@TrioTea
Copy link

TrioTea commented Nov 26, 2024

解码有错误是什么表现啊

@flow3rdown
Copy link
Author

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

@TrioTea
Copy link

TrioTea commented Nov 26, 2024

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

感谢回复,我最近也在看这个任务

@cuicheng01 cuicheng01 added bug Something isn't working ocr labels Nov 27, 2024
@zhangyubo0722
Copy link
Collaborator

收到

@Bb91234567890
Copy link

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

是类似这样吗:
屏幕截图 2024-11-28 163718

@TrioTea
Copy link

TrioTea commented Nov 28, 2024

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

是类似这样吗: 屏幕截图 2024-11-28 163718

看看表格识别模型那个框选结果呢?

@Bb91234567890
Copy link

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

是类似这样吗: 屏幕截图 2024-11-28 163718

看看表格识别模型那个框选结果呢?
训练后的:
屏幕截图 2024-11-28 171930

@Bb91234567890
Copy link

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

是类似这样吗: 屏幕截图 2024-11-28 163718

看看表格识别模型那个框选结果呢?
训练后的:
屏幕截图 2024-11-28 171930

框的颜色是白色的,很难查看

@TrioTea
Copy link

TrioTea commented Nov 28, 2024

@Bb91234567890
可以尝试修改一下那个解码的部分

@Bb91234567890
Copy link

解码有错误是什么表现啊

单元格的坐标看起来会很奇怪,SLANet没有这个问题

是类似这样吗: 屏幕截图 2024-11-28 163718

看看表格识别模型那个框选结果呢?
训练后的:
屏幕截图 2024-11-28 171930

这是官方模型,框的很好:
image

@Bb91234567890
Copy link

可以尝试修改一下那个解码的部分

具体怎么操作呢

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working ocr
Projects
None yet
Development

No branches or pull requests

5 participants