Who speaks?

Speaker recognition using Mel Frequency Cepstral Coefficients (MFCC) and Linde-Buzo-Gray (LBG) clustering algorithm. The implementation is based on this matlab tutorial. It gives about ~65% of correct results using this data set.

Prepare audio files

bash scripts/preprocess-audio.sh

Creates audio-preprocessed folder

Train

./src/cli.js train ./audio-preprocessed/train/

Creates training-results.json

Recognize

Requires training-results.json

./src/cli.js recognize ./audio-preprocessed/test/F101_test_1.wav

Test performance

Requires training-results.json

./src/cli.js test-performance ./audio-preprocessed/test/

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
audio		audio
scripts		scripts
src		src
.eslintrc.json		.eslintrc.json
.gitignore		.gitignore
README.md		README.md
package-lock.json		package-lock.json
package.json		package.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Who speaks?

Prepare audio files

Train

Recognize

Test performance

About

Releases

Packages

Languages

miselaytes-anton/whospeaks

Folders and files

Latest commit

History

Repository files navigation

Who speaks?

Prepare audio files

Train

Recognize

Test performance

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages