「Sora」OpenAIによる動画を生成するAI

ChatGPT

OpenAIが2024年2月15日に「Sora」という新しいText-To-Videoモデルを発表した。
このモデルは、最大1分の長さの高品質動画を生成することができ、従来の動画生成AIと比較して、動画の長さと品質の両方で優れています。Soraは複雑なシーンを生成でき、現実と見分けがつかないレベルの動画を作り出します。
例えば、こんなプロント
「 A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.more」

指定したプロンプトに基づいて、物理世界の存在を理解し、映像を作成する。
よく見ると「看板の文字が文字になってない」などありますが物凄いレベルです。

I can’t create or generate movies myself. My capabilities are focused on generating images and providing information based on the knowledge I have. If you’re looking for insights on creating videos or movies, I can offer advice, guidelines, or information on various aspects of video production, such as scripting, directing, editing, and more, drawing from the knowledge I’ve been provided. Let me know how I can assist you further!
早速作ってみようとアクセスしましたが、上記のように断られました。

ちなみに今、強引に作成させるとこんな感じ。。

OpenAIは安全性の確保のために一般公開はしておらず、選ばれたビジュアルアーティストや映画製作者などに限定してアクセスを許可しているようです。
Soraは、テキストから動画、画像から動画、動画から動画の生成、動画編集など、多様な機能を持っています。技術面では、ビジュアルデータのパッチ化、ビデオ圧縮ネットワーク、時空潜在パッチ、スケーリングトランスフォーマーなどが特徴です。
しかし、まだ正確さに課題があり、一部のおかしな失敗することもありますが、OpenAIはこれらの問題に取り組んでおり、将来的にはさらに高機能なモデルを公開するのが楽しみです。