人工知性を作りたい

私が日々、挑戦したことや学んだことなどを紹介していく雑記ブログです。 (新しいAI技術HTM, 専門の音声信号処理, 趣味のアニメ等も書いてます。)

音声信号処理

HTM(Hierarchical Temporal Memory)のSP層のみを用いた話者照合システムの研究

今回はHTM(Hierarchical Temporal Memory)のSP層のみを用いて話者照合システムを作成し、従来法と比較検討した。 従来法としては以下の二つを用いた。 ・SincNet(現在のstate-of-the-art technology) ・GMM(ガウス混合分布) 従来の誤差逆伝播法で学習す…

感動!数学って素敵やん! 〜離散フーリエ変換したら芸術的な絵が出てきた!〜

どうもこんにちは、 前回の記事で離散フーリエ変換をしていた時に、フーリエ変換がどうなっているのかを途中の結果を抜き出してプロットしてみたら芸術的な絵が出てきたので、みんなと共有したく、ブログを書き始めました。 また、芸術的な絵が出てきたのは…

離散フーリエ変換(DFT)とは?PythonでDFTやってみた!

どうもこんにちは、今回は音声信号処理の基礎「離散フーリエ変換」について紹介していこうと思います。 フーリエ変換 フーリエ変換を適用することで、音の周波数特性を調べることができ、基本音と倍音の配合比率を分析することが出来ます。 本来、フーリエ変…

Pythonで音声信号処理② 〜ITD(両耳間時間差)編〜

今回は久々に技術ブログを書いていこうと思います。 音声信号処理第2弾はITD(両耳間時間差)の技術について紹介したいと思います。 この技術は人間が音の到来方向を感知するときに使っている感覚の1つです。 人が音の方向感で使用する感覚: ・両耳間時間…

Pythonで音声信号処理①

1. wavファイルの読み込み 2. wavファイルの保存 3. 音を変化させてみる 1. wavファイルの読み込み ソースコード: import wave from pylab import * def openFile(filename): wf = wave.open(filename + ".wav", "r" ) fs = wf.getframerate() # サンプリン…