PyTorch 1.1 Tutorials : 画像 : Spatial Transformer ネットワーク (翻訳/解説)
【PyTorch 1.1: Tutorial 画像: Spatial Transformer ネットワーク】
PyTorch 1.1 リリースのチュートリアルの再翻訳を進めています。
今回は「画像」カテゴリーから Spatial Transformer ネットワーク (STN) を扱うチュートリアルです。この視覚アテンション・メカニズムを使用してネットワークを増強することができます。実際に MNIST データセットを題材に、STN で増強した標準的な ConvNet で実験してみます。
STN はニューラルネットがモデルの幾何学的不変性を強めるために入力画像上でどのように空間変換を遂行するかを学習することを可能にします。これは有用なメカニズムになりえます、何故ならば ConvNet は回転とスケールと更に一般的なアフィン変換に対して不変ではないからです。
PyTorch は TensorFlow とともに多く利用されている深層学習フレームワークです。5 月に PyTorch 1.1 がリリースされ 1.0 のドキュメントから追加や修正が入っていますので、順次再翻訳しています。