Stable Diffusion (テキスト-to-画像変換) : 概要 (翻訳/解説)

2022-09-12 2022-09-12

SasakiNoriyuki

【Stable Diffusion (テキスト-to-画像変換) : 概要】
人気を博す Stable Diffusion は潜在的なテキスト-to-画像拡散モデルです。PyTorch で実装されています。

Google の Imagen と同様に、このモデルはテキストプロンプト上で条件付けるために CLIP テキストエンコーダを使用しています。860M UNet と 123M テキストエンコーダを装備したこのモデルは比較的軽量で少なくとも 10GB VRAM を持つ GPU 上で動作します。 [More]

Facebook
X
Bluesky

カテゴリー: PyTorch、ブログ

タグ: #HuggingFace #PyTorch #PyTorchLightly #DiscoArt #DeepLearning #MachineLearning #人工知能 #機械学習 #深層学習 #自然言語処理

Stable Diffusion (テキスト-to-画像変換) : 概要 (翻訳/解説)

潜在拡散モデル (Latent Diffusion Models) : 概要 (翻訳/解説)

ノイズ除去拡散モデル : チュートリアル (翻訳/解説)