居酒屋のメニュー看板(画像)を読み込ませ、ウェブサイトを一発生成させる比較実験を行った。
ここで知りたかったのは、何度も指示を重ねて完成度を上げる段階ではなく、「最初の一歩」として一発でどこまでできるか、という点である。一発出しの時点で、各ツールが何を優先し、どこで崩れるのかを見たかった。

結果は、一発出しでもそれぞれの姿勢がはっきり出た。



まずChatGPTは、素朴なデザインに着地する。見た目として「よめるサイト」を作る方向に強い。また今回は、メニューの数字もできていた。読み取りの確実性を細部まで保証するというよりは、とりあえず形にする感じ。
Gemini Proは厳しい。デザインはGoogleフォームのような印象で、相変わらずダサい。さらに、肝心のメニュー文字が全く読めていない。体裁だけ整えたように見えるが、今回の目的である「メニュー画像を読ませてサイトに反映させる」という点では話にならない、という評価になる。
一方でAntigravityは、色合いが現物に近く、メニューの文字・数字も完璧だった。
現物へ寄せていく気概が見て取れる。ただしレイアウトは崩れており、配置や構造の整え直しは必要になる。それでも、画像の内容再現という一点では段違いで、総合的にはやはりAntigravityが抜けている、という感触になった。

今回の比較はあくまで一発出しだが、最初の一歩の時点でどんな差が出るかが重要だった。
素朴な見た目と一定の読み取りを見せたChatGPT、読めない上に見た目も厳しかったGemini Pro、そして内容再現が突出する一方でレイアウトが課題として残るAntigravity。
居酒屋メニュー画像からサイトを作らせるという文脈では、段突なのはAntigravity、という結論である。

ここまでできるAntigravity、運営管理はお手の物である。
先日もお客様からの手書きの変更依頼を読ませたら綺麗に全部修正してくれた..。
サイトの修正などはほぼ人間の作業は要らなくなったと言えるかもしれない。



