GPT-4.5の登場と初期評価の覚書

ブログ
GPT-4.5の登場と初期評価

2024年2月27日、OpenAIはGPT-4.5をリリースしました。しかし、期待されていたような飛躍的な進化は見られず、実際に使用した感じは微妙です。

性能とコストの課題

GPT-4.5は、前世代モデルと比較して約10倍のモデルサイズを誇るそうです。

  • O1やO3と比べても、特筆すべき性能向上が見られない。
  • ベンチマークスコアも大幅な向上とは言えず、コーディング能力や文書理解能力の改善は限定的。
  • 価格が非常に高額であり、100万トークンあたり150ドルというコストは、同業他社のGemini(0.4ドル)と比較して圧倒的に高い。

ただし、ハルシネーション(誤情報の生成)の減少や、アスキーアート作成能力の向上といった点では改善が見られます。

スケーリング則の限界と今後の展望

AIの性能は「データ量・計算資源・モデルサイズを増やせば向上する」と言われてきました(スケーリング則)。しかし、GPT-4.5ではモデルサイズを10倍にしても、その性能向上が限定的であったことから、スケーリング則の限界?。もしスケーリング則が終焉を迎えたとすれば、OpenAIやソフトバンクのような大規模投資戦略も見直しを迫られる可能性。

今後の期待と課題

GPT-4.5自体のベースモデルとしての性能向上は確認されており、強化学習(SFT/RLHF)を施した「本命モデル:GPT-5」が今後登場するでしょう。

このような状況の中で、AI開発は「単純なスケールアップ」から「賢い最適化」へとシフトするターニングポイントを迎えているのかもしれません。現状のGPT-4.5は「微妙」な仕上がりです。
まだまだ使う側のスキルが大きく作用する気もします。

岡山のホームページ作成