Google Colabを使って音声クローンモデルを作る

使用するツール

Style-Bert-VITS2
litagin02Updated Oct 8, 2024

学習の手順

学習用の音声を用意する

.mp3 ではなく .wav のファイル形式で用意してください。mp3から変換してください。

音声ファイルをGoogle Driveに保存

  • Style-Bert-VITS2フォルダを作成
    • notion image
  • inputs フォルダを作成
    • notion image
  • 用意した音声ファイルを保存
    • notion image

コードを順番に実行していく

完了したらあとは掲載されているコードを順番に実行していきます

環境構築

notion image

初期設定

notion image

データセットの作成

notion image

学習のパラメーターを設定

notion image
続いて実行
notion image

学習

notion image

生成された学習モデル

Google DriveのStyle-Bert-VITS2/model_assets/ に格納されています。「nagaoka」という音声モデルを作った場合はこうなります。
notion image

インストール

Style-Bert-VITS2
litagin02Updated Oct 8, 2024
notion image

© Yusuke Sugino 2024