PyTorch : Tutorial 中級 : Spatial Transformer ネットワーク (翻訳/解説)
【PyTorch Tutorial 中級: Spatial Transformer ネットワーク】
PyTorch の中級チュートリアルを翻訳しています。最新の PyTorch 0.4.0 リリースにも対応しています。
今回は Spatial Transformer ネットワークを扱います。この視覚アテンション・メカニズムを使用してネットワークを増強することができます。
MNIST を題材にして Spatial Transformer ネットワークで増強した標準的な畳み込みネットワークで実験してみます。
Spatial Transformer ネットワークは簡単に言えば、ニューラルネットがモデルの幾何学的不変性を高めるために入力画像上でどのように空間変換を遂行するかを学習することを可能にします。
これは有用なメカニズムになり得ます、CNN は回転、スケールそしてアフィン変換に対して不変ではないからです。
Spatial Transformer ネットワークについて最良なことの一つはそれを僅かな変更で既存の CNN に単純にプラグインするアビリティです。