特徴抽出「Tagger」を使った絵からプロンプトの逆生成

Stable Diffusionで画像を生成していると、描きたい画像があるのにプロンプトになんと書けばいいか分からない。ということはありませんか？

またプロンプトの参考にするために、画像からプロンプトを逆生成したいこともあると思います。

そういった時に、画像から自動でプロンプトを教えてくれる方法について紹介したいと思います。

そこで今回は「似た棒人間から出力した場合の結果」から、2つを比較してみたいと思います。

結果

・画像から簡単に特徴を抽出できる

・寄与度のパーセント値が低いものをプロンプトに含めると、意図しない画像になる可能性がある

この記事を読むと

参考画像から、プロンプトを逆生成する方法の詳細が分かります。

※記事内に広告が含まれています。

リンク

結果
この記事を読むと

「Tagger」とは？
「Tagger」のインストール
【検証】実際に画像から抽出してみた
まとめ
StableDiffusionにお勧めのグラボ

「Tagger」とは？

「Tagger」とは、画像からプロンプトを自動で逆生成する機能のことです。

基本的には、服装や背景などで単語だけでは自身の思い描いた絵を描けない場合に使います。

例えば下記のような複雑な服装を描きたいとなった時に、どこまで表現すればいいか難しいですよね。

また、「Lora」で絵を学習する場合や「reference_only」の機能を使って同じキャラを描きたい場合に有効です。

「Tagger」のインストール

1.「Extensions」タブからInstall from URLを開きます。

2．URL for extension’s git repositoryに下記のアドレスを張り付けて、Installボタンをクリックしてます。

http://github.com/picobyte/stable-diffusion-webui-wd14-tagger.git

3．Installedで「Apply and restart UI」ボタンをクリックして適用して再起動します。

4．念のためStable Diffusion web UI自体を再起動させて下さい。

「Tagger」というタブが追加されていれば、正常にインストールされた証拠です。

【検証】実際に画像から抽出してみた

実際に以前出力した画像を元にプロンプトを逆生成していきます。

プロンプトの出力結果

Taggerタブを開き、画面左にプロンプトを出力したい画像を入れ、「Interrogate image」ボタンをクリックします。

解析が完了すると、右側にプロンプトが逆生成され表示されます。

逆生成されたプロンプト

1girl, solo, breasts, long hair, blue eyes, smile, cleavage, hair ornament, dress, looking at viewer, outdoors, bare shoulders, large breasts, flower, brown hair, white dress, sleeveless, hair flower, kneeling, very long hair, hand up, closed mouth, braid, heart, castle, sleeveless dress, grass

一人の少女という簡単な特徴から、こちらを見ている意味の「looking at viewer」なども出力されています。

逆生成されたプロンプトの下には、それぞれの単語との相関/関連値が表示されます。