ChatGPTo1の実力試し:4o vs o1

ChatGPT

「o1-preview」は、人間が問題を解決する際のプロセスを模倣するようにトレーニングされ、科学、数学、コーディングといった分野での高度な問題解決を可能。

・国際数学オリンピック(IMO)の予選試験では、「o1-preview」は83%のスコアを獲得し、GPT-4oの13%を大きく上回りました。
・競技プログラミング問題(Codeforces)では、89パーセンタイルというスコアを記録..
というので身近なもので試してみました。

いい感じはありますが、やはり不具合が起こるのでいつもの4oにチェックさせてみると

あっさり間違いを見つけれくれたのでo1に確認。

「競技プログラミング問題(Codeforces)では、89パーセンタイルというスコアを記録」というのもいまいちわからなくなってきました。

このように話し合いさせるのも一つの手かもしれません。

岡山のホームページ作成