Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Added :增加python版本离线版本 Punc和VAD ,VAD是16k的。 #17

Open
wants to merge 3 commits into
base: main
Choose a base branch
from

Conversation

standyyyy
Copy link

1、demo修改了支持长音频转录
2、支持各个模型组合转录
3、尝试了多进程和多线程在推理环节,发现多线程快一点

1、增加python版本 Punc和VAD ,VAD是16k的。
@standyyyy
Copy link
Author

不知道是不是忘记说使用的VAD和Punc模型是FunASR的,导致似乎违反了开源协议。
因为第一次提PR ,因此不清楚是哪里违反了开源协议 ,如果知道的话麻烦说一声

@standyyyy
Copy link
Author

关于违反开源协议这个事情,非常抱歉

@SWHL
Copy link
Member

SWHL commented May 7, 2023

不知道是不是忘记说使用的VAD和Punc模型是FunASR的,导致似乎违反了开源协议。 因为第一次提PR ,因此不清楚是哪里违反了开源协议 ,如果知道的话麻烦说一声

这个并没有违反开源协议哈


哇哦,感谢你的PR,等我有空瞅瞅

@SWHL
Copy link
Member

SWHL commented May 8, 2023

hello,你这边可以将这几个功能分拆一下,放到对应的仓库下吗?
Python版的Punc放到 RapidPunc Python这里
VAD的放到RapidVAD这里

今天无意看到FunASR中已经有这两部分的基于onnxruntime的推理代码了,可以参考这里整理

之所以这么分拆是因为便于灵活组合和维护

@standyyyy
Copy link
Author

是的,就是参考了那里的代理,然后按照你代码的思路修改了部分。
好,我拆一下放到对应的库里。

@SWHL
Copy link
Member

SWHL commented May 9, 2023

好的, 如果能给出对应的能跑的示例代码就更好了,我这里便于测试

@SWHL SWHL added the enhancement New feature or request label May 9, 2023
@standyyyy
Copy link
Author

好,测试代码是放在tests,我拆一下补充一下
1、补充一下requirements.txt
2、补充一下README.md
3、把测试代码统一按ASR那边的层级关系放置。
最近在备考证从比较忙,得要周六弄一下

@SWHL
Copy link
Member

SWHL commented May 10, 2023

嗯呢,不着急的,看你时间就行,以自己事情为主

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
Status: Todo
Development

Successfully merging this pull request may close these issues.

2 participants