VoiceEraser

VoiceEraser is a deep learning pipeline that removes human voice from sound clips. The resulting clips can be used for re-commenting (e.g. in the case of sports videos) or as sound effects.

VoiceEraser implements a version of 1D convolutional U-Net architecture to remove voice from audio clips.

Prepare the training data by runnning "Data Preprocessing" jupyter notebook. Then train using "VoiceEraser Training Pipeline" notebook.

The model is trained on the merge of BBC Sound Effects and librivox data.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
train		train
BBCSoundEffects_crowd.csv		BBCSoundEffects_crowd.csv
Data Preparation.ipynb		Data Preparation.ipynb
README.md		README.md
VoiceEraser Training Pipeline.ipynb		VoiceEraser Training Pipeline.ipynb
audio_samples.csv		audio_samples.csv
audio_samples_written.csv		audio_samples_written.csv
test.csv		test.csv
track_speaker.csv		track_speaker.csv
train.csv		train.csv
val.csv		val.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VoiceEraser

About

Releases

Packages

Languages

sapphire008/VoiceEraser

Folders and files

Latest commit

History

Repository files navigation

VoiceEraser

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages