機械学習
今期はテキストから音声を生成するモデル"DiffSound"をpretraindeモデルで動作させる方法を記載します。 入力テキストには「Birds and insects make noise during the daytime」のような文章を使用し、その文章に適した音声が生成されるというモデルになりま…
VAE(Variational Auto Encoder)を理解して使えるようになるために参考にしたサイトをまとめて紹介します。 せっかく時間かけて調べたので誰かの役に立てればと思います。 本記事のテーマ VAEについて詳しく分かるサイト 一番まとまってるサイト(個人的に) …
変分オートエンコーダ(VAE:Variational Auto Encoder)という生成モデルを用いて画像を生成します。 今回は学習データにアニメキャラ(カラー画像、RGB)を使用しました。 本記事のテーマ VAE Model (変分オートエンコーダのモデル) ペコリーヌ、コッコロ…
変分オートエンコーダ(VAE:Variational Auto Encoder)という生成モデルを用いて画像を生成します。 今回は学習データにアニメキャラ(グレースケール)を使用しました。 本記事のテーマ VAE Model (変分オートエンコーダのモデル) 5%-95%を15等分したパ…
研究で音声合成を始めたいと考えている人「何でもいいから音声合成の始め方を知りたい。WaveGlowって凄いらしいから使ってみたい」 趣味で音声合成を始めたいと考えている人「好きな声優・キャラの声で名前を呼ばれたい。音声合成を用いたシステムを作りたい…