PyTorch 1.3 Tutorials : 画像 : Spatial Transformer ネットワーク (翻訳/解説)

【PyTorch 1.3 Tutorials : 画像】
◆ Spatial Transformer ネットワーク (by DeepMind)
PyTorch は TensorFlow とともに多く利用されている深層学習フレームワークです。v1.3 で機能が大幅に追加されてドキュメントも追加・修正が入っていますので、順次再翻訳しています。
今回は「画像」カテゴリーから、Spatial Transformer ネットワーク (STN) を扱うチュートリアルです。この視覚アテンション・メカニズムを使用してネットワークを増強することができます。MNIST データセットを題材に STN で増強した標準的な ConvNet で実験してみます。
STN はニューラルネットがモデルの幾何学的不変性を強めるために入力画像上でどのように空間変換を遂行するかを学習することを可能にします。これは有用なメカニズムになりえます、何故ならば ConvNet は回転とスケールと更に一般的なアフィン変換に対して不変ではないからです。