Stable Diffusion (テキスト-to-画像変換) : 概要 (翻訳/解説)
【Stable Diffusion (テキスト-to-画像変換) : 概要】
人気を博す Stable Diffusion は潜在的なテキスト-to-画像拡散モデルです。PyTorch で実装されています。
Google の Imagen と同様に、このモデルはテキストプロンプト上で条件付けるために CLIP テキストエンコーダを使用しています。860M UNet と 123M テキストエンコーダを装備したこのモデルは比較的軽量で少なくとも 10GB VRAM を持つ GPU 上で動作します。 [More]