昨年の画像生成と比べてみた。技術的な変化は以下のようです。
・拡散モデル × Transformer の統合
・データの“量”から“質”への転換
・美しさ・リアルさを自己評価する仕組み
・巨大計算資源による高精細学習
・シーン全体を理解するマルチモーダル化


ChatGPTでの進化


カメラを持ったことのないAIが、人類が百年以上かけて作った“写真文化”を吸収してしまった世界。
これからは、見た目のリアルさはいくとこまでいき、「同じ人物で別カットを何枚も」「時間の流れを保った動画」など、一貫性の進化になっていきのでしょう。



