TensorFlow : Tutorials : 単純な音声認識 (翻訳/解説)

2018-06-06 2018-06-06

sales-info

【TensorFlow Tutorials : 単純な音声認識】
TensorFlow の Get Started と Programmer’s Guide が再構成されましたが、Tutorials も数編が新規追加されましたので再翻訳しています。
今回は音声認識がテーマで、音声認識における MNSIT を目指したチュートリアルとなっており、10 個の異なる (英) 単語を認識する基本的な音声認識ネットワークをどのように構築するかが説明されます。
モデルは 1 秒の音声クリップを “yes”, “no”, “up”, “down”, “left”, “right”, “on”, “off”, “stop” そして “go” のいずれかに分類します。そしてそれを Android アプリケーション内で実行することも可能になります。
Speech Commands データセットを題材に基本モデルの構築方法が詳述されるだけでなく、背景ノイズのミックスインによるデータセットの増強、カスタムデータ上での訓練、そしてモバイル環境のためのカスタマイズまで網羅されていますので、音声認識モデルの実装入門として最適です。