人工知性を作りたい

私が日々、挑戦したことや学んだことなどを紹介していく雑記ブログです。 (新しいAI技術HTM, 専門の音声信号処理, 趣味のアニメ等も書いてます。)

テキストから音声の生成モデル「DiffSound」を動かす【#Text-to-Sound】【#音声AI】

今期はテキストから音声を生成するモデル"DiffSound"をpretraindeモデルで動作させる方法を記載します。 入力テキストには「Birds and insects make noise during the daytime」のような文章を使用し、その文章に適した音声が生成されるというモデルになりま…

【Unity バグ修正】Scene移動先でUIフォーカスがFirstSelectedに設定したものと異なる

■修正方法1 First Selectedに割り当てたButtonのInspector内になるButtonComponentのNavigation項目をNoneにしてキー入力によるフォーカスを移動しないようにする。

カメラを用いた指認識コントローラーの作り方②指認識【Unity, Mediapipe, Websocket】

【Unity, Mediapipe, Websocket】 カメラで人差し指の位置を認識し、指の動きに連動してアプリ上のキャラクターを動かす。 ・Mediapipeを用いた指のカタチ認識

カメラを用いた指認識コントローラーの作り方①リアルタイム同期通信【Unity, Mediapipe, Websocket】

【Unity, Mediapipe, Websocket】 カメラで人差し指の位置を認識し、指の動きに連動してアプリ上のキャラクターを動かす。 ・サーバーとWebSocketを使ってのリアルタイム同期通信

Raspberry PiでMediapipeをPythonで使用する【pipでインストール】

Raspberry PiでMediapipeをpipでインストールする 下記問題の解決 ・RasbianOSではpipでMediapipeをインストールできない ・python-opencv-contribをインストールすると強制終了する

Raspberry PiでMediapipeの環境構築とBuild、Run【フリーズ問題解決】

本記事の特徴 ・OpenCVのセットアップでフリーズ ・ハローワールドのビルドでフリーズ 上記の問題を解決します。 本記事の特徴 本記事のテーマ 環境構築からHalloWorldの手順 ※追記:問題1と問題2を同時に解決する方法 問題1:OpenCVビルドでフリーズ 問…

ホログラムディスプレイを作ってみた(Unity、100均材料、IPad、ペッパーズ・ゴースト)

本記事のテーマ 作り方 私が使用したもの 完成品画像 関連記事 本記事のテーマ 「ホログラムディスプレイを作ってみた」 よめ子さんというYoutuberの方の動画に感化されて作ってみました。 普段プログラミングという目に見えないものづくりしかしていないの…

【Unity】背景の色が開発環境(黒、Linux)と実機(白、IPad[IOS])で異なる問題解決

背景の色を黒に設定したのですがIPad (IOS)で実行すると白になってなんでだろう〜と考えて半日ぐらいかかったので解決方法を共有します! 本記事のテーマ 不具合解析 解析結果 最後に 本記事のテーマ 「背景の色が開発環境(黒、Linux)と実機(白、IPad[IOS])…

【Unity】外部コントローラの入力キーが異なる問題解決「開発環境(Linux)と実機(IPad, IOS)」

外部コントローラのキー入力を使う際、開発環境(Linux)では上手くいくのに実機(IPad, IOS)では上手くいかなかったのでその時の解決方法をもとに説明していきます! 本記事のテーマ 動作環境 解決方法 手順 IPad内でのDualshock 4のキーコード対応表 最後に C…

Tensor.kthvalueの動作概要

Tensor.kthvalueの使い方について公式のDocumentではよく分からなかったので自分で動作確認した結果をまとめる。 ・公式ドキュメント pytorch.org 本記事のテーマ 関数の説明 動作確認 本記事のテーマ 「Tensor.kthvalueの動作概要」 について実動作確認した…

「映画大好きポンポさん」とある日本人の感想・レビュー

友人に紹介されて見た映画で、学ぶこと心に残ることが多かったので自分が感じた感情を書き記します。 私 仕事:組み込みアンドロイドエンジニア 趣味:ものづくり (ソフトウェア、3Dオブジェクト、動画、歌ってみた等そのとき興味を持っているもの(頻繁に…

librosa install error - Python2.7 Ubuntu20.04 venv仮想環境【個人備忘録】

librosaのインストール出来ない問題の解決です。 原因は特定していません。 エラーログ Requirement already satisfied: enum34; python_version < "3.4" in ./venv_how_dence/lib/python2.7/site-packages (from numba>=0.38.0->librosa) (1.1.10) Collecti…

VTuberになる方法、頭の動きと表情が連動します。 [VTuber Unity - Ubuntu 20.04 venv仮想環境]

UbuntuでVtuberになれるコードを作ってくれている方がいたのでその紹介と動かし方の説明です。 本記事のテーマ 完成品 動画で説明 VTuberになる方法 1. Githubからソースコードを取得する 2. python仮想環境の作成 学習済みモデルの配置、連動するUnity bina…

UbuntuのPython仮想環境venvでcv2.imshowが表示されない件(エラーログも表示されない)#OpenCV

本記事では私がvenv環境でopencvをインストールして使用したときになんのエラーも出ずに固まっていた問題の解決方法を記載します。 本記事のテーマ 問題が起きたときの環境 解決方法 1. opencvのソースコードを取得してビルドする 2. ローカルPythonにインス…

【Unity】フワッと徐々にオブジェクトを出現・生成する方法

本記事はDEMO動画にある、 「Unity+AIを用いた手書き数字識別システム」の実装方法について説明する。 フワッと表示させる処理は下記サイトから引用しました。 Unityで基本オブジェクトをフワッと表示させる - MRが楽しい 本記事のテーマ Demo 実装動画 実装…

【Unity】csv読み込みとObjectsへの画像貼り付け

本記事はDEMO動画にある、 「Unity+AIを用いた手書き数字識別システム」の実装方法について説明する。 前回の記事 www.hiro877.com 前回の記事 本記事のテーマ Demo 実装動画 実装環境 ソースコード CSVの読み込み CSVデータ(1次元)から画像データ(2次元)へ…

【Unity】会話機能(Fungus)の実装とTimelineからスクリプトを実行

本記事はDEMO動画にある、 「Unity+AIを用いた手書き数字識別システム」の実装方法について説明する。 前回の記事 www.hiro877.com 前回の記事 本記事のテーマ Demo 実装動画 実装環境 ソースコード FungusをImportする Fungusの使い方 会話で表示するMessag…

衝突検知(OnCollisionEnter)とイベント発生(Timeline)の実装【Unity】

本記事はDEMO動画にある、 「Unity+AIを用いた手書き数字識別システム」の実装方法について説明する。 前回の記事 www.hiro877.com 前回の記事 本記事のテーマ Demo 実装動画 実装環境 ソースコード Objectの追加 Materialの追加 衝突を検知する方法 スクリ…

ユニティちゃんとカメラの向きをPS4コントローラ(dualshock4)で操作する【Unity】

本記事のテーマ Demo 実装動画 実装環境 ソースコード ユニティちゃんのImport UnityへPackageをインストールする ユニティちゃんを配置する PS4コントローラ(dualshock4)から入力できるようにする ユニティちゃんを動かすスクリプト カメラをキャラクタに追…

MNIST「手書き数字」認識をUnityで表現してみた!

本記事は制作物の説明です。 実装方法は後日、別記事で作成予定です。 本記事のテーマ AIの学習過程をUnityで表現した動画 制作に用いた技術、ライブラリなど 【ゲーム】 【動画制作と音】 筆者の思い 本記事のテーマ MNIST「手書き数字」認識をUnityで表現…

顔認識を利用したアプリの実装【Mediapipe+Python】

本記事のテーマ Demo ソースコード 実行環境 Error plyer: NotImplementedError システム概要 Mediapipe 参考記事 本記事のテーマ 「テレワーク環境下における運動促進システムの作成」 顔認識+タイマー+通知を用いて実装 Demo ソースコード github.com 実行…

FlutterでAudio Recoder App(録音アプリ)を作成

本記事のテーマ 課題 解決方法 ソースコード 本記事のテーマ Flutter初心者向け 初めてFlutterを触った際に詰まったところを共有します。※注:Androidでの動作確認しかしておりません 課題 詰まったところ1.Exampleが動かないhttps://pub.dev/packages/aud…

AndroidデバイスでのFFT処理速度比較:JavaとJNI【備忘録】

本記事のテーマ 概要 結果 筆者のまとめ・見解 参考文献 本記事のテーマ 2013年論文ですが、JavaとJNIにおけるFFTのベンチマーク(速度比較)を検討されていましたので紹介します。 概要 筆者:Antonio D. de Carvalho Jr, Max Rosan, Andre Bianchi, Marcelo …

Django+PostgreSQL設定 Ubuntu+PostgreSQL12で詰まったところ

本記事のテーマ 作業環境 詰まったところ 解決方法 本記事のテーマ Ubuntu+PostgreSQL12で詰まったところについて解決方法を備忘録として記録します。 作業環境 Ubuntu20.04 PostgreSQL12 Django Pycharm 詰まったところ 動かして学ぶ!Python Django開発入…

【実装 変分オートエンコーダ(VAE)】理解するための調査結果まとめ、勉強・参考サイトの紹介 #生成モデル

VAE(Variational Auto Encoder)を理解して使えるようになるために参考にしたサイトをまとめて紹介します。 せっかく時間かけて調べたので誰かの役に立てればと思います。 本記事のテーマ VAEについて詳しく分かるサイト 一番まとまってるサイト(個人的に) …

【実装 変分オートエンコーダ(VAE)】プリコネキャラ画像を生成! Reshapeの形で異なる画像が出現する?!#実験結果 #RGB画像 #color #生成モデル

変分オートエンコーダ(VAE:Variational Auto Encoder)という生成モデルを用いて画像を生成します。 今回は学習データにアニメキャラ(カラー画像、RGB)を使用しました。 本記事のテーマ VAE Model (変分オートエンコーダのモデル) ペコリーヌ、コッコロ…

【実装 変分オートエンコーダ(VAE)】プリコネキャラ画像を生成! #実験結果 #グレースケール #生成モデル

変分オートエンコーダ(VAE:Variational Auto Encoder)という生成モデルを用いて画像を生成します。 今回は学習データにアニメキャラ(グレースケール)を使用しました。 本記事のテーマ VAE Model (変分オートエンコーダのモデル) 5%-95%を15等分したパ…

【Google翻訳、DeepL】英語論文、英語サイトの改行を取り除いて翻訳するChromeアプリを発見しました!

私は英語が苦手なため、英語論文や海外サイトを見る際にGoogle翻訳を活用しています。その時にいつも不便に思うのが、改行文字です。コピーしてGoogle翻訳に貼り付けると大抵、コピー元の改行文字が原因でうまく翻訳してくれません。 この問題を解決してくれ…

AndroidでHTM.core(AIライブラリ)を使えるようにしてみた【 #htm #Androidアプリ 】

従来のディープラーニングと比べ処理量が少ないHTMをAndroidのアプリとして実装したいと思い取り組みました。 Androidは、まだまだ初心者なこともあり使えるようにするだけで2ヶ月半もかかりました!(笑) また、htm.coreの全ての機能を使えるようになった…

ModuleNotFoundError PythonでライブラリImportできない問題解決! 解決手順を例を用いて解説

プログラミングを初めたばかりの皆さんや自分で何かツールやライブラリを作ってみたけど他のディレクトリからImportできない、なんで?と思っている方に向けて解決方法を記載しました。また、ライブラリをpipなどでインストールしたけど使えない方も解決でき…