HuggingFace Diffusers 0.12 : API : パイプライン – 音声拡散 (翻訳/解説)

【深層学習:HuggingFace Diffusers 0.12】パイプライン:音声拡散

今回は「パイプライン」から「音声拡散」です。音声拡散は、音声サンプルをメルスペクトログラム画像に/から変換することにより、拡散モデルを使用した画像生成の最近の進歩を活用しています。

HuggingFace Diffusers はビジョンや音声のような複数のモダリティに対する事前訓練済み拡散モデルを提供し、そして拡散モデルの推論と訓練のためのモジュール型ツールボックスとして機能します。
[More]