人工知性を作りたい

私が日々、挑戦したことや学んだことなどを紹介していく雑記ブログです。 (新しいAI技術HTM, 専門の音声信号処理, 趣味のアニメ等も書いてます。)

音声信号処理

AndroidデバイスでのFFT処理速度比較:JavaとJNI【備忘録】

本記事のテーマ 概要 結果 筆者のまとめ・見解 参考文献 本記事のテーマ 2013年論文ですが、JavaとJNIにおけるFFTのベンチマーク(速度比較)を検討されていましたので紹介します。 概要 筆者:Antonio D. de Carvalho Jr, Max Rosan, Andre Bianchi, Marcelo …

NuPIC(HTM)を用いた話者照合 -2次元入力-【SP+TM層】#異常検知 #notGPU

大学院卒で新入社員となった私ですが、社畜になるつもりはないので、その一環として研究を続けていき、学会などにも出していこうと考えています。 今回の記事までの経緯: ・1次元入力で学習 →なかなか上手くいかない ・2次元入力 →なかなか上手くいかない…

音声合成・分析・変換システム「WORLD」のインストールと声質変換してみた!【MacOS編】

研究で音声合成を始めたいと考えている人「何でもいいから音声合成の始め方を知りたい。」 趣味で音声合成を始めたいと考えている人「好きな声優・キャラの声で名前を呼ばれたい。音声合成を用いたシステムを作りたい。けど、始め方すら分からない、とりあえ…

音の合成と正規化【Pythonで音声信号処理】

【Python・音声信号処理 初心者】 「音を足し合わせたい」 「音を正規化しろって言われたけど、どういうこと?」 「音をいじって遊びたい」 そんな方の疑問に答えます コードが知りたい方は目次のソースコードへ飛んでください! 本記事のテーマ 音の合成と…

超簡単! ダウンサンプリング -サンプリング周波数 / 2【Pythonで音声信号処理】

【Python・音声信号処理初心者】 「研究でサンプリング周波数を揃えないといけない」 「機械学習に入力する際にデータを削減したい」 そんな方の疑問に答えます コードが知りたい方は目次のソースコードへ飛んでください! 本記事のテーマ 簡単ダウンサンプ…

ステレオ→モノラル変換【Pythonで音声信号処理】

【Python・音声信号処理初心者】 「ステレオ音声をモノラル音声に変換したい、仕組みを知りたい!」 「プログラミングで出来るならやってみたい!」 そんな方の疑問に答えます コードが知りたい方は目次のソースコードへ飛んでください! 本記事のテーマ ス…

WaveGlowとGoogle Colaboratoryによる実践音声合成! 〜installからテストまで〜 #機械学習

研究で音声合成を始めたいと考えている人「何でもいいから音声合成の始め方を知りたい。WaveGlowって凄いらしいから使ってみたい」 趣味で音声合成を始めたいと考えている人「好きな声優・キャラの声で名前を呼ばれたい。音声合成を用いたシステムを作りたい…

感動!数学って素敵やん! 〜離散フーリエ変換したら芸術的な絵が出てきた!〜

どうもこんにちは、 前回の記事で離散フーリエ変換をしていた時に、フーリエ変換がどうなっているのかを途中の結果を抜き出してプロットしてみたら芸術的な絵が出てきたので、みんなと共有したく、ブログを書き始めました。 また、芸術的な絵が出てきたのは…

離散フーリエ変換(DFT)とは?PythonでDFTやってみた!

どうもこんにちは、今回は音声信号処理の基礎「離散フーリエ変換」について紹介していこうと思います。 フーリエ変換 フーリエ変換を適用することで、音の周波数特性を調べることができ、基本音と倍音の配合比率を分析することが出来ます。 本来、フーリエ変…

Pythonで音声信号処理② 〜ITD(両耳間時間差)編〜

今回は久々に技術ブログを書いていこうと思います。 音声信号処理第2弾はITD(両耳間時間差)の技術について紹介したいと思います。 この技術は人間が音の到来方向を感知するときに使っている感覚の1つです。 人が音の方向感で使用する感覚: ・両耳間時間…

音声信号処理①〜解決編〜

前回の記事は信号処理の実行方法について紹介しただけなので 今回はプログラムのコードの説明をしていきます。 Youtubeでの解説も行なっていますので、 見てみてください。 mukyouroku.hatenablog.com Volume Boost def volumeBoost(sig, fs): for i in rang…

Pythonで音声信号処理①

1. wavファイルの読み込み 2. wavファイルの保存 3. 音を変化させてみる 1. wavファイルの読み込み ソースコード: import wave from pylab import * def openFile(filename): wf = wave.open(filename + ".wav", "r" ) fs = wf.getframerate() # サンプリン…