X(旧Twitter)で、写真と一緒にJSON(JavaScript Object Notation)コードが貼られている投稿を見かけることがあります。
いったい何をしているのかというと、簡単に言えば「好きな写真を“設計図(レシピ)”として言語化し、似た雰囲気の画像を何度も作りやすくする」試みです。ここで注意したいのは、設計図といっても「ピクセルまで完全一致するコピー機」ではないことです。再現できるのは、あくまで雰囲気や構造、つまり“型”です。
では、その設計図は何からできているのでしょうか。写真1枚には、複数の要素が同時に入っています。たとえば構図(真上から撮る、余白を大きく取る)、背景(無地、グレーのグラデーション)、光(柔らかいトップライト、影の出方)、色味(彩度控えめ、ニュートラル、コントラスト弱め)、そして被写体の条件(服の色、表情、小物の有無)といった具合です。AIは画像を見て、これらをかなりの程度まで言葉に分解できます(ただし推定なので、細部は揺れることもあります)。その分解結果を項目ごとに整理して書いたものが「設計図」です。
そこで登場するのがJSONです。JSONはHTMLのように「見せる」ための形式ではなく、情報を整理して並べるための書式です。比喩的に言うなら、HTMLが盛り付けの皿だとすれば、JSONは材料と手順を書いたレシピカードに近い存在です。設計図の中身を、構図・背景・光…といった項目に分けて保存しやすい形にしてくれるため、後から修正したり、別の生成指示に転用したりが楽になります。
設計図を持つと何が嬉しいのか。たとえば「トップダウン+柔らかい光+ニュートラルな色味」という型を固定できれば、服だけ変える、背景だけ変えてシリーズを量産する、同じ型で被写体を差し替えて統一感あるビジュアルを作る――といった操作がやりやすくなります。写真が「完成品」から「再利用できるテンプレート」に変わるわけです。
ただし、完全コピーはできません。生成AIは確率的に絵を作るため、同じ設計図でも毎回わずかに揺れます。できるのは、同じ設計思想で作った“別バージョン”を安定して出すことです。料理で言えば、同じレシピでも焼き色が少し違う、あの感覚に近いでしょう。


一番シンプルな頼み方はこうです。「この写真を解析して、構図・背景・光・色・被写体条件をJSON形式で整理した画像生成プロンプト(設計図)にして」。あとは設計図を少しずつ直しながら、「設計図→試作→修正」を回していく。最初から完璧を狙うより、そのループに入った人が、結局いちばん早く“狙った型”に辿り着きます。






