Japanese Stable CLIP を試してみた

Fooocus


Stable Diffision を、シンプルな WebUI にしたツールです。基本的にはプロンプトの入力だけで画像の生成ができる形です。セットアップもシンプルです。

準備

いつもの Docker イメージで起動します。なお、Fooocus はデフォルトで使用するポートが 7865 になるので、転送するポートもそれにあわせています。
docker run -it --gpus=all --rm -p 7865:7865 -v /work:/work nvidia/cuda:11.8.0-base-ubuntu22.04 /bin/bash

必要なツールをインストールします。
apt update
apt install -y git python3-pip libgl1-mesa-dev libglib2.0-0

Fooocus のリポジトリをクローンし、pip で必要なライブラリをインストールします。
git clone https://github.com/lllyasviel/Fooocus.git
cd Fooocus
pip3 install -r requirements_versions.txt

生成

WebUI を起動します。必要なモデルは自動的にダウンロードします。(ので、初回起動は少し時間がかかります)
python3 entry_with_update.py --listen

こんな感じの、非常にシンプルな UI が起動します。プロンプトを入れて Generate するだけです。Negative Prompt の入力欄すら表示されないほどです。

1枚生成するのに 30 秒弱ぐらい。SDXL ならこのくらいはかかる感じです。

モデルは別途ダウンロードして使用することもできますが、プリセットがリアル系とアニメ系で用意されています。リアル系なら
python3 entry_with_update.py --listen --preset realstic

アニメ系なら
python3 entry_with_update.py --listen --preset anime


簡単ですね。なお、プロンプト入力欄下にある、「Input Image」をクリックすれば画像から画像を生成する機能 (Inpainting や Outpainting)、「Advanced」をクリックすれば細かいパラメータを指定することも可能になります。

コメント