AIで絵を描く場合は出来るだけ詳しく文章で絵を制作しますよね。
ですが逆に単語だけではどうなるか?
特にHDDのようなPCパーツで略語になっているものが、StableDiffusionではどのように判断されるか、確認してみたいと思います。
また今のプロンプト描く絵にマンネリ感や、物足りなさを感じてる方も必見です!
今までのプロンプトに今回の単語を加えることで、サイバーパンク調の絵が描けるようになるので、絵の幅が広がるようになります。
なので、自分の絵に何か変化を加えたいと思ってる人は是非、この記事の単語を足してみてください。
結果
・HDDやAMDなどはサイバーパンク調の女の子の絵が出力される
・世界的に知名度が低い物は、反映されない
・メカのような画像やサイバーパンク調の画像を描くのに、PCのパーツ名をプロンプトに加算するのは有効
この記事を読むと
各単語に対してStableDiffusionがどのように判断しているかが分かります。
※記事内に広告が含まれています。
使用する単語類
世間的にはASAP(As Soon As Possible)のような略語もありますが、今回はPCパーツに限定してどうなるかを確認してみたいと思います。
Promptには下記の表の入力のみを記載して、NegativePromptには下記のように人間に関すること記載しています。
Prompt
入力 | パーツ名/意味 |
PC | パソコンの略 |
CPU | パソコンの演算や制御の中心となるデバイス |
Intel | CPUのメーカー |
AMD | CPUのメーカー |
RAM | 揮発性メモリ データの一時保存領域 |
ROM | 不揮発性メモリ データの保存領域 |
HDD | ハード・ディスク・ドライブの略 |
SSD | ソリッド・ステート・ドライブの略 |
FD | フロッピーディスクの略 |
CD | コンパクトディスクの略 |
MD | ミニディスクの略 |
SD | セキュア デジタルの略 |
DVD | デジタル‐バーサタイルディスクの略 |
NAND | デジタル回路の論理演算でNot AND |
GPU | 映像の処理を専門に行うプロセッサー |
DIY | 自分自身で物を作成すること |
NegativePrompt
worst quality, low quality, blurry
flat color, flat shading, retro style, poor quality, bad face,
bad anatomy, bad hands, missing arms, text error, missing fingers, jpeg artifacts, long neck, signature, watermark, blurry, fisheye lens, animal, deformed mutated disfigured, mutated hands, missing hands, extra hands, liquid hands, poorly drawn hands, mutated fingers, bad fingers, extra fingers, liquid fingers, poorly drawn fingers, bad legs, missing legs, extra legs, bad arms, extra arms, long torso, thick thighs, partial head, bad face, partial face, bad eyebrows, ugly
出力結果
PC
PCはそれっぽい画像になりましたね。
直線がもう少し綺麗に書けると本物のPCに近づきそうです。
人が描かれる割合は半々でした。
CPU
CPUもやはりそれ以外の略語の意味がないためか、サイバーパンク調の絵になりました。
ほとんど無人の絵でしたが、1,2枚人が混じってました。
なぜRPG風なのかは分かりませんが…
Intel
Intelと言えばCPUと認知されているようです。
そのためPC内のCPU部分をアップにしたような画像が出力されました。
PC内部に焦点が当たっているためか、人は出力されませんでした。
AMD
Intelに比べてCPUが出力されることが少ないです。
赤色の女の子が出力されることが多いようですが、たまに自然も出力されています。
サイバーパンクというよりは、レースなどのジャージを出力されることが多い気がします。
RAM
揮発性メモリよりは、羊になってしまうようです。
ただ単純な羊というよりは、羊要素の入った女の子が出力されました。
ただPC関連の画像は1枚も出ませんでした。
ROM
一番良く分からない結果になりました。
何となく機械っぽいものの出力頻度が高いようですが、たまに自然が出てくるようです。
あまりサイバーパンク調にはならないです。
HDD
HDDという単語からか、PCの筐体のような画像も良く出力されました。
ただどちらかと言うと、サイバーパンク調の女性が多く出力されるようです。
服装はAMDと似たような画像が出力され、赤い髪の女の子が出力されやすいようです。
SSD
HDDよりは、他解釈が多いためかPC関連は少なかったです。
ただしSSDの筐体も出力頻度は低くないため、学習数は少なくないようです。
出力される女性はAMDやHDDと違い、水色系の画像が多く出力されるようです。
FD
フロッピーディスクはそもそも学習していないか、「フロッピーディスク」という単語でしか出てこないためか、保存ボタンで見るような画像は出力されませんでした。
また車のFD3Sの学習があるのか、頻度は低いですが車の画像も出力されました。
ただ出力された車の種類は、86やBRZに近いものが多かったです(最近の車のため学習数が多いのかもしれません)
CD
女性の比率が多いですが、一定数円盤状の何かが映っています。
逆に円盤だけの画像は出力されませんでした。
また他プロンプトに比べて巨乳の割合が多いように感じます。
MD
MDは日本以外での認知はほぼなかったためか、出力されることはなかったです。
そのため、女性は出力されるのですが、様々な絵が出力されました。
SD
一部、サイバーパンク調の絵も出てきますが、解釈が多いためか色んな画像が出力されました。
なぜか全体的に夏のような画像が多く出力されました。
DVD
CD同様に女性の比率が多いですが、一定数円盤状の何かが映っています。
DVDも逆に円盤だけの画像は出力されませんでした。
NAND
NANDから論理回路の学習に基づいたPCパーツのような画像が多く出力されました。
逆にPC等の機械とは真逆の自然も多く出力されました。
GPU
サイバーパンク調の女性が多く出力されます。
ただしHDDなどと違って青を基調とした画像が多く出力されました。
またタブレットやモニターのような、画面に関わる絵も多いです。
DIY
木材を使用した棚などを作ることを指すことが多いため、木製の扉や棚が画像に多く見られます。
「PCの自作」などとプロンプトに定義しないと、サイバーパンク調にはならないようです。
既存画への追加効果確認
上記の確認で、サイバーパンク調の画像になった「AMD」「HDD」を既存のプロンプトに足してどうなるか確認してみます。
使用する画像とプロンプトは下記を使用します。
Prompt
(best quality, masterpiece, 16k, ultra detailed, beautiful skin, professional lighting),upper body, create a blank space above the head, beautifully painted, 1 girl, young,20 years old, short hair, bob cut, shiny hair, black clothes, blonde eyes, light smile, white skin
NegativePrompt
worst quality, low quality, blurry
flat color, flat shading, retro style, poor quality, bad face,
bad anatomy, bad hands, missing arms, text error, missing fingers, jpeg artifacts, long neck, signature, watermark, blurry, fisheye lens, animal, deformed mutated disfigured, mutated hands, missing hands, extra hands, liquid hands, poorly drawn hands, mutated fingers, bad fingers, extra fingers, liquid fingers, poorly drawn fingers, bad legs, missing legs, extra legs, bad arms, extra arms, long torso, thick thighs, partial head, bad face, partial face, bad eyebrows, ugly
HDD
女性がロボットやアンドロイドのような姿になりました。
また他の絵では、パイロットスーツのような姿になりました。
AMD
AMDは思ったよりも、大きく変化はありませんでした。
強調を行っても差が出なかったですが、洋服は日常の服とは違ったものに変化しています。
まとめ
今回は、PCパーツ名だけでStableDiffusionを実行するとどうなるかについて紹介しました。
改めて3行でまとめると…
・HDDやAMDなどはサイバーパンク調の女の子の絵が出力される
・世界的に知名度が低い物は、反映されない
・メカのような画像やサイバーパンク調の画像を描くのに、PCのパーツ名をプロンプトに加算するのは有効
単純な一枚絵を描くのは簡単ですが、AIで大量出力していくと個性が埋もれてしまいますよね。
そんな時に一単語、全然違う単語を加えるだけで、絵柄が変わることもあるのがAI絵の面白いところです。
是非今の絵に物足りなさやマンネリ感を感じた時は、上記の単語を加えてみてください。
StableDiffusionにお勧めのグラボ
ここまでの記事を読んでStableDiffusionを始めてみたいと思ったけど、どれを買ったか良いか分からない人向けに私の使っているグラボを紹介します。
私が使用しているグラボはNVIDIA GeForce RTX3060 搭載 グラフィックボード GDDR6 12GBになります。
StableDiffusionで絵を生成するときは、PCのCPUやメモリよりもグラボの性能が重要です。
StableDiffusionではVRAMが12GB以上であることが推奨されていますが、普通のゲーム用のグラボでは8GBのものが多いです。
経験上、一回のプロンプトで一発で望みの絵が出ることは少なく、10枚ぐらい出力してそこから近づけていく作業をします。
しかしVRAMが低いと1枚を生成する時間が長くなってしまいます(完全にVRAM依存ではないですが)
1枚の生成する時間が長いと、最終的なゴールまでの時間も多くかかってしまうので、推奨要領である12GBのグラボを買うことをお勧めします。
VRAMが低い=一度に計算できる数が少ない=生成速度が遅い
そのため解像度の高い絵を生成するのに時間がかかるだけでなく、生成できない可能性もあります(2GBや4GBなど)
Controlnet等、拡張機能を複数使用する場合やLora等の学習を行う場合は、より顕著にVRAMの差が出ます。
そのため単純にAIで出力してみたい。というだけでなく、その一歩先で色々やってみたい方は是非12GB以上を購入してみてください。
ちょっと試すだけなら、下記のような無料AI画像生成サービスを使うのも良いです。
コメント