Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

是否支持英文en呢? #42

Open
shen2009fei opened this issue Jan 30, 2023 · 11 comments
Open

是否支持英文en呢? #42

shen2009fei opened this issue Jan 30, 2023 · 11 comments

Comments

@shen2009fei
Copy link

是否支持英文en呢?

@chenkui164
Copy link
Owner

只支持中文或者中英文,不支持英文,如果有英文需求可以使用kaldi2里面提供的模型,https://github.com/k2-fsa/icefall

@shen2009fei
Copy link
Author

只支持中文或者中英文,不支持英文,如果有英文需求可以使用kaldi2里面提供的模型,k2-fsa/icefall

兄弟 我用paraformer 的方式 ,测试英文 字母 I 和其他单词 没有空格分开。测试了两个wav文件都是这样,能讲一下在哪里修改能解决这个问题?
Result: "Iknocked at the door on the ancient side of the building".
Result: "have you got any cheese may Ihelp you".

@chenkui164
Copy link
Owner

chenkui164 commented Jan 30, 2023

能提供一下音频么?我debug一下啊,这里确实没怎么测试过,需要修改https://github.com/chenkui164/FastASR/blob/main/src/lib/Vocab.cpp 里面的vector2stringV2这个函数

@shen2009fei
Copy link
Author

@chenkui164
Copy link
Owner

好的,可能需要等两天了,我把这部分代码重构一下,当时偷懒没考虑的太周全

@chenkui164
Copy link
Owner

@shen2009fei 已经修复这个bug,可以抽空试试了

@shen2009fei
Copy link
Author

@shen2009fei 已经修复这个bug,可以抽空试试了

兄弟 感谢修复,非常好用 感谢。 请问这个支持服务的形式吗?这样便于前端调用。

@chenkui164
Copy link
Owner

不支持,这个项目只做推理过程,接口部分需要自己实现

@shen2009fei
Copy link
Author

shen2009fei commented Feb 11, 2023

有段音频识别,know 和 后面的Is 合并在一起了。

Two two two it's one o'clock have you ever been to china what's your name I don't knowIs that okay sure pretty cool
newRecord 2.wav.zip

@chenkui164
Copy link
Owner

临时的解决方案是将代码
while (audio.fetch(buff, len, flag) > 0) {
mm->reset();
string msg = mm->forward(buff, len, flag);
cout << msg;
}
改为
while (audio.fetch(buff, len, flag) > 0) {
mm->reset();
string msg = mm->forward(buff, len, flag);
cout << msg << " ";
}

由于里面涉及到VAD分句和中英文混合的问题,我还没想好怎么改,临时先怎么用吧

@shen2009fei
Copy link
Author

临时的解决方案是将代码%3B-,cout%20%3C%3C%20msg,-%3B) while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg; } 改为 while (audio.fetch(buff, len, flag) > 0) { mm->reset(); string msg = mm->forward(buff, len, flag); cout << msg << " "; }

由于里面涉及到VAD分句和中英文混合的问题,我还没想好怎么改,临时先怎么用吧

先这么解决了,我部署到服务器 发现服务器识别比我本地还慢1秒:) . 主要是用paraformer的代码。 我发现要么paraformer的模型如果剪小就可以部署到移动端,或者推理利用多线程 或者其他技术能把速度提高,直接服务端部署就完美了。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants