Skip to content

Instantly share code, notes, and snippets.

@shimesaba-type0
Last active June 4, 2023 02:44
Show Gist options
  • Save shimesaba-type0/586fe5cf1832eb4b36bbe30ef48cc319 to your computer and use it in GitHub Desktop.
Save shimesaba-type0/586fe5cf1832eb4b36bbe30ef48cc319 to your computer and use it in GitHub Desktop.
ddPn08 さんのリポジトリを使って音声を学習させる

目的

備忘録

今回のサンプル音源

青空文庫さんから利用させていただきました。ただ、商用利用は避けたほうがいいと思います。あと、SNS に流すのもできるだけ避けたほうがいいと思います。

https://aozoraroudoku.jp/

これの

https://aozoraroudoku.jp/voice/rdp/rd1077.html

これ

image

ダウンロードする

リポジトリ

下記リポジトリをクリックして開こう

https://github.com/ddPn08/rvc-webui-colab/tree/main

リンクをクリックして Colab を開く

image

矢印の先をクリックして Colab を開く

自分の Google Drive にコピー

image

1, 2 の順にやればよいと思います
コピーするとこんな感じになっているはず(タイトルに のコピー とついている)

image

GPU 設定を確認する

image

で、開いて

image

こうなっていれば OK
とくにハードウェアアクセラレータが GPU になっていること

全部実行

image

全部実行しちゃいましょう
途中で Google Drive へのアクセスを許可するためのウィンドウが出てくると思うので、許可してください

image

地味にこの状態が長く続くのでゆっくり待ちましょう

URL をクリックして RVC webui を開く

image

これ

image

こんな web ページが開く

トレーニングしよう

Training タブをクリックする

image

モデル名は任意で。でも、たぶん半角及び全角スペースはないほうがいい

image

こんな感じで OK

Dataset glob はデフォルトの Google Drive のマウント先であれば以下の通りでよい
/content/drive/MyDrive/AI/rvc-webui/*.wav

image

Google Drive を開き学習させたい wave ファイルをアップロードする
分割されていても、気にせず全部アップロードする
で、あとはとりあえずデフォルトで OK
Train をクリックして学習実行

image

web ui での表示

image

Google Colab での表示

image

Colab のほうが進捗が表示されてわかりやすいですね
終わったかな?

image

次は、 Training model... って表示になった

image

Colab は?

image

何かやってますね
待ちます

image

100% になった

image

webui でも completed の表示

pth ファイルをダウンロードする

Google Colab で フォルダのマークをくりっくして rvc-webui をクリックする

image

rvc-webui -> models -> checkpoints の順でクリックしていくと先ほど指定した モデル名.pth というファイルができている

image

3点メニュー?をクリックする(マウスホバーすると現れる)

image

ダウンロードをクリックして任意の場所にダウンロードする

image

50MB 以上あると思うので、気長に待つ

image

青い丸がだんだんできる。これが進捗状況
OS のデフォルトのダウロードフォルダか、ブラウザのしていしているダウンロードフォルダ、もしくは保存場所を聞いてくる

vc client でヴォイスチェンジ

vc client の導入は省略
起動も省略

起動したら RVC を選ぶ

image

select で 先ほどダウンロードしたファイルを選択する
upload で vc client にアップロードする

image

下のような表示になれば OK

image

chunk と extra data はこんな感じで、あとはとりあえずデフォルトで

image

デバイス等は自分の好きなようにしましょう
start を押して、音声変換が出来ているか確認しましょう

image

できてた?おめでとうございます!
ともに Enjoy しましょう!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment