Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開

Stability AIは2023年7月26日、同社の開発するテキストによるAI画像生成モデルSDXL（Stable Diffusion XL）の新バージョンSDXL 1.0をリリースした。

ANNOUNCING SDXL 1.0 -Stability AI

Stability AIが最新のテキストから画像を生成するモデル、Stable Diffusion XL 1.0をリリース。
Amazon Bedrockで利用可能に。@clipdropapp では今すぐ使えます！https://t.co/LxVgOdhUe4 #StabilityAI #AI #AIcommunity #TextToImage #OpenSource #AWS #SDXL pic.twitter.com/SW73NRpziK
— Stability AI 日本公式 (@StabilityAI_JP) July 26, 2023

SDXLは短いプロンプトの入力でAIにより精細な画像を創り出すことができる画像生成モデル。これまで同社のユーザや研究者向けにベータ版等の形で提供されてきたが、SDXL 1.0はオープンソースとして公開される（ライセンスはCreativeML OpenRAIL++-Mライセンス⁠）⁠。

SDXL 1.0では従来のバージョンに比べ最大のパラメータ数となる3.5B（35億）パラメータベースの単一モデルと6.6B（66億）パラメータを持つリファラーによる新しいアーキテクチャが採用されている。最初のステップで基本モデルがノイズを含む（表示されない）画像を生成し、その後、最終的なノイズ除去に特化した改良モデルで処理される。基本モデルはスタンドアロンでも使用できる。この2段階のアーキテクチャにより処理速度が向上し、コンピューティングリソースの節約につながるとのこと。SDXL 1.0は、8GB VRAMを搭載したコンシューマ向けGPU、あるいは手軽に利用できる構成のクラウドインスタンスで効果的に動作するという。

SDXL 1.0はClipdropで公開されており、プロンプトを入力して実際の画像生成を試すことができる。またソースコードはGitHubで公開されている。クラウド上ではAWS SageMakerとAWS Bedrockで利用可能。