神野さんに言われました。

読者です 読者をやめる 読者になる 読者になる

神野さんに言われました。

AIの勉強をしています @sesenosannko

音声分析アプリを作った

こんにちは。

先週の金曜日に音声分析アプリを作って、昨日今日でtkinterのアプリにしました。
そこまではよかったのですが、sptk等を使っていたことを完全に失念していたので、アプリ化するのが非常に面倒になったので諦めました。
今回で懲りたのと、神野さんが毎日のようにWEBアプリを勧めてくるので、次何かを作るときはWEBアプリで作ることになると思います。

作ったアプリはこんな感じです。
仕組みはお遊びなので非常に単純です。

動画の説明欄にある通りですが、僕の主観で6種類に分けたサンプル音声群に対してそれぞれ平均的な混合ガウス分布を学習して、録音した音声に対してそれぞれの分布との尤度を元にスコアをつけています。
平均の分布を用いることに関しては微妙な点ですが、一人ずつそれぞれの分布を学習して尤度を平均した結果と大きな差はなかった(と判断した)ので速度の観点から平均分布を用いることにしました。

ここまではそこまでは悪く無いのですが、良い録音環境で録音されたプロの声に対しては妥当と思える値を出すのに対して、違う録音環境の一般人の声に対しては桁が違うレベルで小さい値が出てしまいました。
録音環境の問題が大きいのか、声質の問題なのか、この結果も研究素材としては面白いんですが、三田祭が近くてそうも言っていられなかったので、0〜5点の間で良い感じの値になるように事後処理を加えています。