PyTorch 1.1 : Tutorials : 画像 : TorchVision 物体検出再調整チュートリアル (翻訳/解説)
【PyTorch 1.3 Tutorials : 画像】
◆ TorchVision 物体検出再調整チュートリアル
PyTorch は TensorFlow とともに多く利用されている深層学習フレームワークです。11 月に PyTorch 1.3.1 がリリースされています。1.3 では機能が大幅に追加されてドキュメントも追加・修正が入っていますので、順次再翻訳していきます。
今回は「画像」カテゴリーから、物体検出の再調整を扱うチュートリアルです。歩行者の検出とセグメンテーションのために事前訓練された Mask R-CNN モデルを再調整していきます。題材はPenn-Fudan データセットで歩行者の 345 インスタンスを伴う 170 画像を含みます。インスタンス・セグメンテーションモデルを訓練するために torchvision の新しい特徴をどのように使用するかを示します。
チュートリアルは「Getting Started」「画像」「音声」「テキスト「強化学習」「分散訓練」等々のカテゴリーに分かれています。