最近かなり使っている、Antigravity で Claude Opus 4.6 (thinking) を使って Planning し、実装を Codex の GPT-5.4 high に渡し考える工程と作る工程を分けています。
Antigravity は、Google 公式でも「agent-first development platform」とされ、タスクを受けると task list や implementation plan、さらにスクリーンショットや録画を含む Artifacts を出して確認しながら進める設計です。つまり、いきなり実装させるより、まず「どう作るか」を固めるのに向いています。
ここで Claude Opus 4.6 (thinking) を使う意味があります。Anthropic は Opus 4.6 について、長時間の難しいタスクへの強さや、plan before acting、コードレビューや複雑な変更への強さを打ち出しています。上流で要件整理や方針決めを任せる役として、かなり優秀です。もちろん実装まで任せてもいいのですがクレジット料金は高めです。

実装は、Codex で GPT-5.4 high に渡すのが強い。OpenAI は GPT-5.4 を agentic・coding・professional workflows 向けの主力モデルと位置づけており、reasoning.effort で high が使えコーディング力に加え、長いタスクやツール利用を伴う仕事にも強いと案内されていますし実感しています。
GPT-5.4: 約7 credits
GPT-5.3-Codex: 約5 credits
GPT-5.1-Codex-mini: 約1 credit


Opus 4.6 は設計者、GPT-5.4 high は職人が良い気がします(2026.3)。
LP改修、フォーム改善、複数ファイルにまたがる修正のように、先に設計を固めた方が事故が減る案件では、この組み合わせはかなり強いと思います。逆に、軽いCSS修正ならCodexだけで十分です。
気をつけるのは、Antigravity で設計を固めたらきちんと一度止めて、 Codex に実装を渡すこと。これで「二人の船頭」ではなく、かなりきれいな分業ができます。



