Stable Diffusion

https://github.com/Stability-AI/stablediffusion

2022年8月に公開されたようなので、今更ではありますが、Stable Diffusion というものを知りました。Text to Image、作りたい画像を文字で記述すると画像を生成してくれるツールです。

Microsoft も、OpenAI と協力して Bing Image Creator をリリースしていますが、それと同様のツールです。それらとの大きな違いは、ローカルマシンで動かせる、オープンソース (多分) なツールであること。

ローカルマシンで動かせるといっても、Web 上で見かけるインストールしてみた系の情報では「コスパ重視」で RTX3060 を選ぶと良い！なんて書かれている程度のマシンを所有している前提です。手元にあるのは Quadro K2200M に載せ替えた 8560w。VRAM は 2GB なので、さすがに無理そうな気がしますが、一応やってみます。

Stable Diffusion はそのままだと使いづらいので、WebUI を使います。

https://github.com/AUTOMATIC1111/stable-diffusion-webui

上記リポジトリをクローンし、webui-user.bat を実行してみます。モデルのダウンロードが行われますが、