GitHub - w-okada/ttsclient

TTSClient

[日本語] [English] [한국어] [中文简体]

Text To Speech(TTS)のクライアントソフトウェアです。各種AIに対応していく計画です。(現時点ではGPT-SoVITSのみ)

対応 AI
- GPT-SoVITS
- coming soon...

demo2.mp4

ダウンロード

Hugging Faceのリポジトリよりダウンロードしてください。

win_stdエディション：Windows向けのCPUで動作するエディションです。cuda版と比較して低速ですが、最近のそれなりのスペックのCPUであれば動きます。
win_cudaエディション：Windows向けのNVIDIAのGPUで動作するエディションです。GPUのハードウェアアクセラレーションにより高速に動きます。
macエディション：Mac(Apple silicon(M1, M2, M3, etc))向けのエディションです。

使用方法

zipファイルを展開後、start_http.batを実行してください。表示された、URLにブラウザでアクセスしてください。
start_https.batを使用すると、リモートからでもアクセスすることができます。
(上級者向け)start_http_with_ngrok.batを使用するとngrokを用いたトンネリングを使用してアクセスすることができます。

note: macエディションは.batを.commandで読み替えてください。

GPT-SoVITS

モデルの詳細はGPT-SoVITSの公式リポジトリを参照してください。

GPT-SoVITSでは、モデルと参照音声と参照テキストを選択してから、音声生成を行います。TTSClientでは参照話者という概念があり、参照話者に複数の参照音声と参照テキストを持たせることができます。

音声生成

モデルと、参照話者を選択します((1), (2))。
参照話者に登録された参照音声と参照テキストを選択します(3)。
生成したいテキストを入力して音声を生成します(4)。

モデルの登録

モデル選択エリアの編集ボタンから登録してください。

参照話者の登録

参照話者登録エリアの編集ボタンから登録してください。

参照音声、テキストの登録

参照音声選択エリアで未登録のスロットを選択して登録してください。

Acknowledgements

JVNVコーパス

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.vscode		.vscode
tests		tests
ttsclient		ttsclient
.gitignore		.gitignore
README.md		README.md
README_cn.md		README_cn.md
README_en.md		README_en.md
README_ko.md		README_ko.md
mypy.ini		mypy.ini
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
w_okada's_TextToSpeech_version_2_x.ipynb		w_okada's_TextToSpeech_version_2_x.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TTSClient

関連ソフトウェア

ダウンロード

使用方法

GPT-SoVITS

音声生成

モデルの登録

参照話者の登録

参照音声、テキストの登録

Acknowledgements

About

Releases

Packages

Languages

w-okada/ttsclient

Folders and files

Latest commit

History

Repository files navigation

TTSClient

関連ソフトウェア

ダウンロード

使用方法

GPT-SoVITS

音声生成

モデルの登録

参照話者の登録

参照音声、テキストの登録

Acknowledgements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages