Saqoosha

2023.04.12

Diary

drikin 声の RVC デモが衝撃的でやってみたくなってリポジトリの説明どおりにやってみるもいつものように素直には動かなくっていろいろいじくってるうちにエラー吐きながらもいちおう動いたっぽいけど一般人の声を学習させるのはそこそこの長さの学習元になる音声を入手するほうがハードル高いよなー。

2023.04.13

Diary

RVC は公式のじゃない webui のが調子よくって爆速で学習してくれるんで社内の Zoom 録画をあさってデータ整理して学習させて VC Client でその人の声を拝借して会議してみたけどまーやっぱりその人っぽさというのは単に声だけではなくって話し方とかイントネーションとかの要素もすごい重要なんでそのへんが適当だとバレるんだけど逆にそのへんちゃんとするとすごいその人になれるんで危険…

2023.04.14

Diary

2021 年ぐらいのライブラリだと Python 3.7 とか TensoFlow 1.15 とか CUDA 10.2 とかいろいろ古くてなんとか古いバージョンインストールしてもぜんぜん素直に動いてくれなくって WSL Docker も最新なら GPU 認識するけど古いのはダメで結局なにしてもダメで今日の成果はゼロ。