21.【生成AI実験】同じ「京都」でもここまで変わる|画像生成プロンプト指示語10パターン比較
tags:
- 生成AI
- 画像生成
- プロンプト
- 実験
- Kyoto
🎯 はじめに
画像生成AIを使っていると、
「それっぽい画像は出るが、なぜそうなったのか分からない」
という状態に陥りがちである。
本記事では、
テーマを「京都」に固定したまま、
プロンプト中の「指示語」だけを変えることで、
- 何を変えると
- 画像のどの要素が
- どの程度変化するのか
を整理して観測する。
🎯 目的
👉 プロンプトを
「呪文」ではなく「制御入力」として理解すること。
🧠 なぜ「京都」を選んだか
「京都」は、画像生成の挙動を観測する題材として非常に扱いやすい。
- 🏙 実在都市であり、学習データが豊富
- 🏯 伝統・観光・生活・現代都市が混在
- 🎨 写実・イラスト・抽象のどれにも転びやすい
つまり、
1語の違いによる変化が、視覚的に分かりやすい
という特徴を持つ。
本記事は
「正解を出す」ためではなく、「変化を観測する」ための実験である。
🔬 実験条件(固定ルール)
以下の条件をすべて固定する。
- テーマ語:Kyoto / 京都
- 1回の実験で変える要素:1つのみ
- モデル:DALL·E / Stable Diffusion / Midjourney など(特定しない)
- 観測対象:
- 構図
- 雰囲気
- 写実度
- 抽象度
🔬 「何を変えたか」が常に一意になるようにする。
⚙️ ベースプロンプト(共通)
以下を共通ベースとし、
各実験では差分のみを変更する。
Kyoto landscape,
clean composition,
natural lighting,
no text, no logo, no watermark
⚙️ ここでは「良い画像」を狙わない。
あくまで「変化が分かること」を優先する。
「京都」固定・10パターン実験表 🔬
| No. | 変更点 | プロンプト差分 | 主な変化 | 観測ポイント |
|---|---|---|---|---|
| 1 | 名詞 | Kyoto landscape photograph |
実写・観光写真寄り | 実在スポットへの吸着 |
| 2 | 名詞 | Kyoto landscape illustration |
絵・ポスター調 | 配色と構図の整理 |
| 3 | 抽象度 | abstract visualization of Kyoto landscape |
建物が溶ける | 意味より雰囲気 |
| 4 | 具体性 | realistic Kyoto street scene |
生活感・路地 | 写実性の上昇 |
| 5 | 感情語 | calm and quiet Kyoto landscape |
静的・低彩度 | 光と色の抑制 |
| 6 | 感情語 | dramatic Kyoto landscape |
演出過多 | 雲・夕焼け強化 |
| 7 | 時代 | Kyoto scenery in Edo period style |
日本画・版画調 | 様式が写実を上書き |
| 8 | 時代 | modern Kyoto cityscape |
都市・現代感 | 観光京都から乖離 |
| 9 | 視点 | aerial view of Kyoto |
俯瞰構図 | 地理情報の強調 |
| 10 | 視点 | street-level view of Kyoto |
人の視点 | 奥行き・物語性 |
🔬 生成結果の比較(10パターン)

図1:テーマを「京都」に固定し、
プロンプト中の指示語のみを変更した10パターンの生成結果
🧠 観測結果の整理
① 最初の名詞が世界観を決める
photographillustrationvisualization
この最初の名詞1語で、
画像の方向性は ほぼ決定される。
🧠 世界観ロック用の語として、最重要。
② 抽象語は「意味」を溶かす
abstractdreamlikeinspired by
を加えると、
- 建物形状
- 道路構造
- 空間的整合性
が意図的に曖昧化される。
👉 曖昧さはバグではなく、探索用パラメータ。
③ 感情語は色と光に作用する
- calm / quiet
→ 彩度低下、朝夕、霧 - dramatic
→ 強コントラスト、逆光、雲
🧠 感情語は
感情ではなく「視覚演出」を制御している。
⚠️ ④ 時代指定は最強パラメータ
- Edo period
- modern
のような指定は、
建築・服装・色彩・構図
すべてを一気に上書きする
⚠️ 便利だが、他の指示をほぼ無視する点に注意。
⑤ 視点指定は構図を固定する
- aerial view
- street-level view
は、
- カメラ位置
- 奥行き
- 情報密度
をほぼ強制的に決定する。
👉 構図制御が目的なら最優先で指定すべき要素。
⚙️ 実運用への示唆
- 🎯 アイキャッチ画像
→ 名詞+感情語を最初に置く - 📘 教材・説明図
→diagram / schematic / preciseを明示 - 🎨 雰囲気画像
→ 抽象語+ネガティブ指定 - 🔬 比較実験
→ テーマ固定+差分1語
✅ まとめ
- プロンプトは呪文ではない
- プロンプトは 制御入力
- 曖昧さは悪ではなく 観測対象
- 1語変えるだけで、結果は大きく変わる
まずは
「テーマ固定 × 差分1語」
から始めるのが最も理解が早い。
以上。