HuggingFace ブログ : 画像分類用 ViT の微調整 (翻訳/解説)
【HuggingFace ブログ : 画像分類用 ViT (Vision Transformer) の微調整】
この記事は 🤗 transformers で事前訓練済み ViT (Vision Transformer) を微調整する方法を説明しています。
transformers ベースのモデルが NLP に変革をもたらしたように、現在では他のあらゆるドメインに適用した論文の爆発的な増加を引き起こしています。これらの最も画期的な一つが Google Brain 研究者チームにより 2021年6月に紹介されVision Transformer (ViT) です。 [More]