12日連続の発表:「o1」「o3」の覚書

ChatGPT

1. OpenAIの新モデル O1とO3

  • O1モデル: 「思考する」プロセスを取り入れ、深く考えた上で回答を出す性能を実現。これにより、数学やプログラミングでトップレベルのパフォーマンスを発揮。
    • : 数学オリンピック基準を突破するスコアや、プログラミングコンテストで上位11%に入る成績。
    • O1プロモード: 通常よりも深く、10分以上思考する機能を搭載(200ドル/月のサブスクリプションプラン)。
  • O3モデル: O1の上位モデルで、さらに高度な思考と高精度な回答が可能。ただし、コストが1タスクあたり15万円以上と非常に高価になる予定。

2. 動画・音声生成の進化

  • 動画生成ツール「Sora」のリリース:
    • プロンプトを入力することでリアルな動画やアニメ風の映像を作成可能。
    • ストーリーボード: シーンの流れを指定して、一連の動画を生成。
    • リミックス機能: 動画内の特定オブジェクトを他のものに差し替える。
  • アドバンスドボイスモード:
    • AIとのビデオ通話が可能になり、表情や身振りなども含めた自然な対話を実現。

3. チャットを超えたAIエージェント

  • キャンバス機能:
    • AIと共同で文章を編集し、コメントをつけたり改善案を提示したりする機能。
  • デスクトップ統合:
    • AIが他のアプリケーション(例: ノーション)と連携し、環境全体を理解して行動。
    • 必要に応じてウェブ検索やデータ参照をしながらタスクを進行。

4. Googleとの競争

  • OpenAIのリリース直後にGoogleが類似の技術を発表。
    • ThinkKingEX (Google): 思考を取り入れたAIモデル。
    • Veo2: Soraよりも精密な動画生成が可能とされる新モデル。

5. 今後の重要なポイント

  • 「学ぶ」から「考える」への移行:
    • AIの学習はデータの限界に達しており、今後は「考える」能力の向上が重要。
    • しかし、「考える」ための計算コストが高いという課題が浮上。
  • 文脈の理解:
    • 映像や音声などを活用し、AIが利用者の背景情報を理解する能力が進化。
  • アプリケーションの進化:
    • モデル自体の競争から、UI/UXの使いやすさやアプリケーションの実用性が重視される時代に。

学びと今後の展望

  1. OpenAIとGoogleの競争: 両社が技術・アプリケーションで競い合い、より便利なサービスが増える。
  2. 思考モデルの進化: 思考プロセスを搭載したAIの進化が加速し、2025年には使いやすさが大幅に向上。
  3. エージェント化: AIが自立的に行動し、ユーザーと協働する未来が現実化。

OpenAIの発表は、単なる技術的な進化にとどまらず、AIが実社会でどのように価値を発揮するかを再定義するものでした。

岡山のホームページ作成