Speech Enhancement

Speech Enhancement 是一个基于深度学习模型的语音降噪和去混响工具。

支持多种格式音频文件
基于 CPU 推理的语音增强模型
基于 EBU R128 标准对响度进行归一化处理
分片并行处理，提高处理效率

安装

Docker

拉取Docker镜像

dockerHub

docker pull goomd/ghcr.io.tech-podcasts.speech_enhancement:latest

Github Packages

docker pull ghcr.io/tech-podcasts/speech_enhancement:latest
启动容器

dockerHub

docker run -p <主机端口>:8080 -d goomd/ghcr.io.tech-podcasts.speech_enhancement:latest

Github Packages

docker run -p <主机端口>:8080 -d speech_enhancement:latest

其中，主机端口是指用户在主机上访问该服务的端口。

使用

你可以通过浏览器访问主机的端口，即可使用该服务。

我们的处理链默认音频格式为采样率44100Hz,采样深度16bit的wav文件，如果你的文件不是这个格式会进行转码操作，从而会增加一定的处理时间。

最终完成的文件将是一个wav文件，所以文件会比原文件大很多。以mp3为例，如果原文件大小为10M，那么处理后的文件大小将会是50M左右。

性能

在 4 核 8 线程的 CPU 上，处理 40 分钟的音频文件，耗时在5分钟左右。

参考

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
.github/workflows		.github/workflows
dist		dist
docs/img		docs/img
media_info		media_info
meta		meta
process		process
templates		templates
tests		tests
upload		upload
uploads		uploads
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
go.mod		go.mod
go.sum		go.sum
main.go		main.go

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Speech Enhancement

安装

Docker

使用

性能

参考

About

Releases 1

Packages

Languages

License

tech-podcasts/SpeechEnhancement

Folders and files

Latest commit

History

Repository files navigation

Speech Enhancement

安装

Docker

使用

性能

参考

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages