特徴抽出「Tagger」を使った絵からプロンプトの逆生成

特徴抽出「Tagger」を使った絵からプロンプトの逆生成 AI/Stable Diffusion

Stable Diffusionで画像を生成していると、描きたい画像があるのにプロンプトになんと書けばいいか分からない。ということはありませんか?

またプロンプトの参考にするために、画像からプロンプトを逆生成したいこともあると思います。

そういった時に、画像から自動でプロンプトを教えてくれる方法について紹介したいと思います。

そこで今回は「似た棒人間から出力した場合の結果」から、2つを比較してみたいと思います。

結果

・画像から簡単に特徴を抽出できる

・画像から簡単に特徴を抽出できる

・寄与度のパーセント値が低いものをプロンプトに含めると、意図しない画像になる可能性がある

この記事を読むと

参考画像から、プロンプトを逆生成する方法の詳細が分かります。

※記事内に広告が含まれています。

「Tagger」とは?

「Tagger」とは、画像からプロンプトを自動で逆生成する機能のことです。

基本的には、服装や背景などで単語だけでは自身の思い描いた絵を描けない場合に使います。

例えば下記のような複雑な服装を描きたいとなった時に、どこまで表現すればいいか難しいですよね。

また、「Lora」で絵を学習する場合や「reference_only」の機能を使って同じキャラを描きたい場合に有効です。

「Tagger」のインストール

1.「Extensions」タブからInstall from URLを開きます。

2.URL for extension’s git repositoryに下記のアドレスを張り付けて、Installボタンをクリックしてます。

http://github.com/picobyte/stable-diffusion-webui-wd14-tagger.git

3.Installedで「Apply and restart UI」 ボタンをクリックして適用して再起動します。

4.念のためStable Diffusion web UI自体を再起動させて下さい。

「Tagger」というタブが追加されていれば、正常にインストールされた証拠です。

【検証】実際に画像から抽出してみた

実際に以前出力した画像を元にプロンプトを逆生成していきます。

プロンプトの出力結果

Taggerタブを開き、画面左にプロンプトを出力したい画像を入れ、「Interrogate image」ボタンをクリックします。

解析が完了すると、右側にプロンプトが逆生成され表示されます。

逆生成されたプロンプト

1girl, solo, breasts, long hair, blue eyes, smile, cleavage, hair ornament, dress, looking at viewer, outdoors, bare shoulders, large breasts, flower, brown hair, white dress, sleeveless, hair flower, kneeling, very long hair, hand up, closed mouth, braid, heart, castle, sleeveless dress, grass

一人の少女という簡単な特徴から、こちらを見ている意味の「looking at viewer」なども出力されています。

逆生成されたプロンプトの下には、それぞれの単語との相関/関連値が表示されます。

パーセント数が低いほど、「書かれているけど、そのプロンプトを使用して生成しても上手く反映されないかも」ぐらいに思ってください。

パーセント値が低いものプロンプトに組み込むことで逆に絵が破綻することもありますので注意が必要です。

また、Taggerでは逆生成されるプロンプトはポジティブのみになります。

そのため、品質や手足の欠損などに関するネガティブプロンプトは自分で打ち込む必要があります

Taggerで出力したプロンプトから画像生成した結果

上記でも書いた通り、Taggerではポジティブプロンプトしか出力されないので、ネガティブプロンプトやSamplingmethodなどは自分で決めていきます。

上記のプロンプトに品質や手足欠損のネガティブプロンプトを追加して出力した結果が下記になります。

ドレスの感じや髪型などが元画像に近い結果が出力されました。

まとめ

今回は『Tagger』を使用して、絵からプロンプトを逆生成する方法について紹介しました。

改めて3行でまとめると…

・画像から簡単に特徴を抽出できる

・画像から簡単に特徴を抽出できる

・寄与度のパーセント値が低いものをプロンプトに含めると、意図しない画像になる可能性がある

スーツや制服など現実で名前が付いている服装は簡単に出力できますが、ファンタジーの世界など想像の世界の服装を説明するのは難しいですよね。

ですが、もし参考にしたい画像があれば、そこから特徴抽出することで、あなたの描きたい服装に近づけられるかもしれません。

是非Taggerを使って新しいプロンプトを逆生成して、自分の絵に活用してみてください!

コメント

タイトルとURLをコピーしました