Stable Diffusion とは？AI画像生成の基礎知識【Step 1】| ImagInAI

// 01. 基本の「き」

一言でいうと？

Stable Diffusion（スタブルディフュージョン）は、テキスト（文章）や画像を入力するだけで、AIが高品質な画像を自動生成してくれるソフトウェアです。

2022年に公開され、世界中のクリエイターや開発者の間で爆発的に普及しました。最大の特徴は完全無料かつオープンソースであること。自分のパソコンにインストールして、制限なく使えます。

🔍 たとえるなら？

「犬が青い空の下で走っている水彩画」とテキストで入力するだけで、AIがそのイメージを「想像」して1枚の絵を描いてくれます。まるで24時間働いてくれる、超高速の画家です。

🎨

テキストから画像を生成

英語や日本語のプロンプト（指示文）を入力するだけで、AIが絵を描いてくれます。

🖼️

画像から画像を変換

既存の画像をアップロードして「こんな風に変えて」と指示することも可能です。

🆓

完全無料・商用利用可

ソフト自体は無料。生成した画像も多くのモデルで商用利用が認められています。

💻

自分のPCで動かせる

ローカル環境（自分のPC）にインストールして使います。データが外部に送られません。

// 02. 他との違い

Midjourneyや
DALLEと何が違うの？

AI画像生成ツールはいくつかありますが、それぞれに特徴があります。下の表で比べてみましょう。

ツール	価格	ローカル動作	カスタマイズ性	初心者向け
Stable Diffusion	完全無料	◎ 可能	◎ 最高	△ 学習が必要
Midjourney	月額 $10〜	✕ クラウドのみ	△ 限定的	◎ 使いやすい
DALL·E 3 (ChatGPT)	月額 $20〜	✕ クラウドのみ	△ 少ない	◎ 使いやすい
Adobe Firefly	プランによる	✕ クラウドのみ	○ 中程度	○ 比較的簡単

📌 ポイント

Midjourneyは「すぐ綺麗な絵が作れる」初心者向け。でもStable Diffusionは無料で、モデルを自由に変えられて、細かい調整が可能。少し学べば圧倒的に自由度が高いです。

// 03. 仕組み

AIはどうやって
絵を描くの？

Stable Diffusionは「拡散モデル（Diffusion Model）」という技術を使っています。難しそうに聞こえますが、考え方はシンプルです。

📖 用語解説：拡散モデルとは？

「砂嵐のようなノイズ（ランダムな点々）から、少しずつ形を作っていく」技術です。AIがランダムなデータを段階的にきれいな画像へと変換していきます。

01

テキストを理解する

あなたが入力したプロンプト（例：「夕焼けの海と白い猫」）を、AIが数値（ベクトル）に変換して意味を理解します。

02

ノイズからスタート

真っ白なキャンバスではなく、「砂嵐」のようなランダムな点々の集合から開始します。

03

少しずつノイズを除去

プロンプトの意味に沿って、何十〜何百ステップもかけてノイズを除いていきます。徐々に輪郭が現れてきます。

04

完成！

最終的に、プロンプトに対応した鮮明な画像が完成。このプロセスが数秒〜数分で起こります。

🎨 もっとわかりやすく言うと？

霧の中から彫刻が浮かび上がるイメージ。最初はぼんやりしていて、回数を重ねるごとにくっきりと形になっていく感じです。AIはその「霧を晴らす方向」をテキストから学んでいます。

// 04. 歴史

Stable Diffusionの
歩み

急速に進化してきたSD（Stable Diffusion）の主要な歴史を見てみましょう。

2022.8

SD 1.x 登場

Stability AIが公開。誰でも無料で使えるAI画像生成ツールとして世界中で話題に。

2022.11

SD 2.0 リリース

解像度や品質が向上。ただし1.x系とモデルの互換性がなく、当初は混乱も。

2023.7

SDXL 1.0 登場

大幅な品質向上。より高解像度で、リアルなプロンプト理解が可能に。

2024〜

SD 3.x・Flux 等登場

さらに進化したアーキテクチャが次々登場。テキスト表現力も劇的に改善。

// 05. 活用例

こんなことができる！

Stable Diffusionを使えば、以下のようなことが実現できます。

🖌️

イラスト・アート制作

アニメ風、油絵風、写真風…スタイルを指定してオリジナルイラストを量産できます。

📸

リアルな人物・風景写真

本物と見分けがつかないほどリアルな人物写真や風景写真を生成可能。

🎮

ゲーム素材・コンセプトアート

インディーゲーム開発者がキャラクターや背景素材を素早く作るために活用。

🛍️

商品イメージ・広告素材

プロダクトビジュアルやSNS投稿画像を低コストで大量生成。

🧑‍🎨

自分の絵柄でAI生成（LoRA）

自分の絵柄や特定のキャラクターをAIに学習させて、一貫したスタイルで生成。

🔄

写真・画像の変換・修復

古い写真を綺麗にしたり、背景を変えたり、画像の一部を書き換えることも可能。

// 06. 準備

どんなPCが必要？
（予習）

ローカルでStable Diffusionを動かすには、ある程度のスペックが必要です。詳細は次のステップで解説しますが、ざっくり確認しておきましょう。

⚡ 最重要：VRAM（GPUのメモリ）

VRAM（ブイラム）とはグラフィックボード（GPU）専用のメモリのこと。Stable Diffusionの動作速度と品質に直結します。最低4GB、推奨8GB以上が目安です。

GPU VRAM	動作	おすすめ用途
4GB未満	△ かなり厳しい	Google Colabなどクラウドの利用を推奨
4〜6GB	○ 動作可能	SD 1.5系モデル中心、低解像度メイン
8GB	◎ 快適	SDXL・Fluxも一部可能。初心者の推奨環境
12GB以上	◎◎ 最適	Flux、SDXL全力、高解像度も余裕

💻 GPUを持っていない場合は？

大丈夫！Google Colabなどのクラウドサービスを使えば、自分のPCのスペックに関係なく高品質な画像を生成できます。インストール方法のステップで詳しく説明します。

Stable Diffusion
って、なに？

一言でいうと？

テキストから画像を生成

画像から画像を変換

完全無料・商用利用可

自分のPCで動かせる

Midjourneyや
DALLEと何が違うの？

AIはどうやって
絵を描くの？

テキストを理解する

ノイズからスタート

少しずつノイズを除去

完成！

Stable Diffusionの
歩み

SD 1.x 登場

SD 2.0 リリース

SDXL 1.0 登場

SD 3.x・Flux 等登場

こんなことができる！

イラスト・アート制作

リアルな人物・風景写真

ゲーム素材・コンセプトアート

商品イメージ・広告素材

自分の絵柄でAI生成（LoRA）

写真・画像の変換・修復

どんなPCが必要？
（予習）

基礎はバッチリ 🎉

Stable Diffusion って、なに？

一言でいうと？

テキストから画像を生成

画像から画像を変換

完全無料・商用利用可

自分のPCで動かせる

MidjourneyやDALLEと何が違うの？

AIはどうやって絵を描くの？

テキストを理解する

ノイズからスタート

少しずつノイズを除去

完成！

Stable Diffusionの歩み

SD 1.x 登場

SD 2.0 リリース

SDXL 1.0 登場

SD 3.x・Flux 等 登場

こんなことができる！

イラスト・アート制作

リアルな人物・風景写真

ゲーム素材・コンセプトアート

商品イメージ・広告素材

自分の絵柄でAI生成（LoRA）

写真・画像の変換・修復

どんなPCが必要？（予習）

基礎はバッチリ 🎉

Stable Diffusion
って、なに？

Midjourneyや
DALLEと何が違うの？

AIはどうやって
絵を描くの？

Stable Diffusionの
歩み

SD 3.x・Flux 等登場

どんなPCが必要？
（予習）