人工知性を作りたい

私が日々、挑戦したことや学んだことなどを紹介していく雑記ブログです。 (新しいAI技術HTM, 専門の音声信号処理, 趣味のアニメ等も書いてます。)

機械学習

テキストから音声の生成モデル「DiffSound」を動かす【#Text-to-Sound】【#音声AI】

今期はテキストから音声を生成するモデル"DiffSound"をpretraindeモデルで動作させる方法を記載します。 入力テキストには「Birds and insects make noise during the daytime」のような文章を使用し、その文章に適した音声が生成されるというモデルになりま…

【実装 変分オートエンコーダ(VAE)】理解するための調査結果まとめ、勉強・参考サイトの紹介 #生成モデル

VAE(Variational Auto Encoder)を理解して使えるようになるために参考にしたサイトをまとめて紹介します。 せっかく時間かけて調べたので誰かの役に立てればと思います。 本記事のテーマ VAEについて詳しく分かるサイト 一番まとまってるサイト(個人的に) …

【実装 変分オートエンコーダ(VAE)】プリコネキャラ画像を生成! Reshapeの形で異なる画像が出現する?!#実験結果 #RGB画像 #color #生成モデル

変分オートエンコーダ(VAE:Variational Auto Encoder)という生成モデルを用いて画像を生成します。 今回は学習データにアニメキャラ(カラー画像、RGB)を使用しました。 本記事のテーマ VAE Model (変分オートエンコーダのモデル) ペコリーヌ、コッコロ…

【実装 変分オートエンコーダ(VAE)】プリコネキャラ画像を生成! #実験結果 #グレースケール #生成モデル

変分オートエンコーダ(VAE:Variational Auto Encoder)という生成モデルを用いて画像を生成します。 今回は学習データにアニメキャラ(グレースケール)を使用しました。 本記事のテーマ VAE Model (変分オートエンコーダのモデル) 5%-95%を15等分したパ…

WaveGlowとGoogle Colaboratoryによる実践音声合成! 〜installからテストまで〜 #機械学習

研究で音声合成を始めたいと考えている人「何でもいいから音声合成の始め方を知りたい。WaveGlowって凄いらしいから使ってみたい」 趣味で音声合成を始めたいと考えている人「好きな声優・キャラの声で名前を呼ばれたい。音声合成を用いたシステムを作りたい…