
絵が書けないけど、AIでクォリティの高い画像を作ってみたい
AIが分からないけど、AIの画像作成に興味がある
初心者だけど何をやってよいか分からない
「stable diffusion」を使うなら、このような悩みを簡単に解決してくれます。
AIというと難しいイメージがあるかもしれないですが、
使い方は簡単で、とても楽しいです。
特に私が最初の頃に「stable diffusion」を使った時は「AIでどんな画像が作れるのか?」とワクワクしながら画像を作っていました。
この記事では、stable diffusionの使い方を初心者向けにわかりやすく解説していきます。
これからAIで画像を作ってみたいと思っているなら、必見の内容になっています。
stable diffusionとは?
「stable Diffusion」は画像生成AIのことで、誰でもテキストの説明から画像を作成できる新しいテクノロジーです。
人が書いた絵と同程度のものが瞬時に生成することができるので、今までになかった画像を生成するAIとなっています。
また、オープンソースで開発されていて、ソースコードが公開されているので、誰でも制限なく使うことできるという手軽さがあります。
しかも、簡単な操作で画像を作れることから、初心者でも簡単に使うことができます。
stable diffusionが人気の理由
「stable Diffusion」が爆発的に広まった理由としては以下があります。
・使いやすい
「stable diffusion」は非常に使いやすいツールです。AIや画像生成の経験がなくても、誰でも画像を作成できます。
・用途が広い
「stable diffusion」を使用して、リアルなポートレート、抽象的なアート、2次元イラストまで、さまざまな画像が作成できます。
・高性能
「人間が書いたものと遜色のない画像を生成できる」ので非常に高性能です。
・クリエイティブ
「stable diffusion」により、ユーザーは創造性を発揮し、さまざまなスタイルやテクニックを試すことができます。
・無料で使える
「stable diffusion」は、誰でも利用できる無料のツールです。
・アップデートが早い
「stable diffusion」は常に改善されています。ツールやモデルの開発が早く、1ヶ月単位でみてもかなりのアップデートがあります。
全体として、「stable diffusion」は強力で用途の広いツールであり、絵が書けないけど、画像を作成したい人には最適なツールです。
また、使いやすく、無料で使えて、常に改善されています。画像の作成に興味がある場合は、stable diffusionを試してみることをお勧めします。
stable diffusionを実行する方法
大きく分けて2つの実行方法があります。
1.ブラウザで提供されているサービスを使う
2.ローカル環境(自分のpc)にインストールして使う
どちらもメリット、デメリットがあり、自分にあった環境での選択となっています。
1.ブラウザで提供されているサービスを使う
ブラウザ環境では以下の特徴があります。
・有料サービスになっている
・pcの環境に関係なく使えるというメリットがある
・用意されている絵柄しか出力できないため、好きなモデルが使えないというデメリットがある
・インストール不要で、すぐに開始できる。
2.ローカル環境(自分のpc)にインストールして使う
ローカル環境では以下の特徴があります。
・ローカル環境はpcのスペックが必要(グラフィックボードが必須)
・制限なく好きなように使うことができる(ブラウザのサービスでは回数制限がある)
・常にアップデートされるモデルを自由に選ぶことができる
・自分で学習させることができるため、オリジナルのモデルを作れる
・ツールが優秀でインストールは簡単にできるので、事前の知識は特に不要
ローカル環境で実行するにはゲーミングpcクラスのスペックが必要ですが、
本格的にAIで画像を作成したいなら、制限がなく自由に実行ができるローカル環境にすることをお勧めします。
両方を比較した時に、一番の大きな違いは、ローカル環境のみ学習させることが出来ることです。
学習とは自分でオリジナルのモデルが作成できることです。
他人のモデルを使うだけでは物足りないというなら、ローカル環境は必須になります。
ブラウザ環境で実行するwebサービス
一番お手軽に試せるのが、ブラウザ環境で実行するwebサービスです。
インストールなどの面倒な作業も不要で、事前準備なしですぐに始められます。
stable diffusion online
Stable Diffusionの公式サイトです。
無料で体験できるサービスですが、画像の生成には少し時間がかかります。
初心者が体験するにはよいサイトで、フォトリアリスティックな画像を生成することができます。
DreamStudio
Stablitiy AI社が開発したツールで、最初の200回までは無料で作成することができます。
それ以降は有料のサービスになっています。
生成スピードが早いのが特徴で、画像AIを体験するにはよいサービスです。
フォトリアリスティックな画像を生成することができます。
mage
無料で無制限に画像を生成できるサービスです。
有料プランだと画像の生成が早くなります。
フォトリアリスティックな画像を生成することができます。
Leonardo.Ai
使用するにはホワイトリストの申請が必要なため、はじめるには時間がかかります。
無料プランでも1日最大150枚生成可能で、初心者が体験するにはかなりおすすめのサイトです。
高画質な画像が作成することができます。
ローカル環境で実行するための必要環境
グラフィックボード(gpu) VRAM 4G
メモリ 16G
が最低限、必要なスペックです。
ただ、上記のスペックだとかなり厳しくて、実行するにもかなり時間がかかります。
快適に動作するにはVRAM 12G以上が必要で、RTX3060のグラフィックボードがおすすめです。
これならば、待ち時間がかなり短縮されますので、ストレスなく画像が作成できます!
現状のリリースされているグラフィックボードでは、メモリあたりのコスパが非常よく、stable diffusionで使うならかなりおすすめのグラフィックボードになります。
私もこのRTX3060のグラフィックボードを使用していますが、快適に画像を作成できています。
購入したのは去年で価格を比較してみたら1万前後ぐらい安くなっていました。価格的にも5万円きっていますし、今購入するのはお手頃だと思っています。
stable diffusion web uiのインストール方法
「stable diffusion」をローカル環境(自分のpc)で実行するにはツール「stable diffusion web ui」をインストールする必要があります。
「stable diffusion web ui」のインストール方法はこちらで解説しています。
AIを使用して独自の画像を生成したいなら、「stable diffusion web ui」を使うのが最適です。 初心者にも使いやすく高機能なツールで多くのユーザーが使用しています。 今回は、「stable diffus …
stable diffusion web uiの使い方
画面は英語ですが、入力することはたいしてないので簡単です。難しいと感じることはないと思います。
Prompt
プロンプト(呪文)を入力します。
画像の指示を文章で入力する項目です。
Negative prompt
ネガティヴプロンプトを入力します。
画像に出力して欲しくない要素を入力する項目です
Sampling method
画像生成に利用するアルゴリズムの種類です。
おすすめは一般的によく使われているDPM++ 2M Karrasです。
Sampling steps
画像生成するために、改善をどれだけするかの回数です。
少なすぎると改善しきれずにノイズが出力されます。
20〜40ぐらいが目安になります。多いほど時間がかかりますので、
ノイズが出力されない範囲で値を設定するのがベストです。
Width
生成する画像の横幅。
横幅を増やすとよりVRAMが必要になるので、大きさには限界があります。
(数値を上げる場合、スペックの低いグラフィックボードを使うとエラーになります)
512〜1024の範囲で指定するのが、標準的なサイズです。
Height
生成する画像の高さ。
高さを増やすとよりVRAMが必要になるので、大きさには限界があります。
(数値を上げる場合、スペックの低いグラフィックボードを使うとエラーになります)
512〜1024の範囲で指定するのが、標準的なサイズです。
Batch count
一回の生成で何枚画像を生成するかの値です。同じ設定で複数枚の画像をまとめて作成したい場合に指定します。
画像の生成方法
今回、画像生成の例として最低限で入力する方法を紹介します。
Prompt
1 girl
1人の少女という指示です。
Negative prompt
bad face, bad fingers, bad anatomy, missing fingers, flat color, flat shading, low res, retro style cropped, signature, watermark, username, artist name
ネガテイブプロンプトは必須で、指定しないと意図しない画像が出力されます。
こちらの詳しい内容はこちらで解説しています。
「AIに描きたい絵を伝えるためには、どのような文章を書けばいいのか分からない」という方も多いのではないでしょうか。 私自身も最初にやってみた頃はその悩みを感じていた1人です。 そこで、今回は「プロンプト(呪文)」について …
Sampling method
「DPM++ 2M Karras」
がおすすめの設定です。
これらを入力して、「Generate」のボタンを押します。
(後はデフォルトで問題ないです)
処理が終了すると以下のように画像が表示されます。
stable diffusionで作成した画像の出力先
「stable diffusion」で作成された画像はインストールで解凍したsd.webuiフォルダの以下の階層に保存されます。
sd.webui\webui\outputs\txt2img-images\日付
「stable diffusion」で画像を作る場合、一度に多数を作成することが多いと思います。エクスプローラーだと何の画像が保存されているか見づらいと思いますので、画像ビューワーを使うことをおすすめします。
プロンプトの書き方
上記の例は簡単なプロンプトでしたが、プロンプト次第で高クオリテイの画像を作ることができます。
プロンプトの書き方は、かなりボリュームがありますので、こちらにまとめています。
「AIに描きたい絵を伝えるためには、どのような文章を書けばいいのか分からない」という方も多いのではないでしょうか。 私自身も最初にやってみた頃はその悩みを感じていた1人です。 そこで、今回は「プロンプト(呪文)」について …