これは心理学でも知られる現象で、「ピンクの象を思い浮かべるな」と言われると、逆にピンクの象を思い浮かべてしまうというものです。
→ 人間の脳は、否定文よりも肯定文のイメージを処理しやすい傾向があります。
LLMもこの性質をある程度引き継いでおり、
- 「〇〇しないで」と書かれた指示よりも
- 「〇〇してください」という肯定的な表現の方が
意図通りに動作しやすい傾向があります。
■ LLMにおける「否定命令」の課題
ChatGPTなどのLLMは、大量のテキストを学習しているため、「禁止命令」や「〜しないで」という表現に出会うことも多くあります。
しかし、以下のような問題があります:
| 否定命令の例 | 起こりうる挙動 |
|---|---|
| 「絶対に暴力的な表現を使わないでください」 | 一部の文脈では「暴力的な表現」というトピック自体に反応して出力してしまう場合がある。 |
| 「次の文ではジョークを使わないで」 | 逆にジョークの文体を想起してしまう可能性。 |
これは「ピンクの象を思い浮かべるな」に似ています。LLMは文中に登場したトピックを重視しがちなため、「使うな」と言っても、その語彙やスタイルに注意が向いてしまいます。
■ 実用上のおすすめ:否定文→肯定文への書き換え
意図通りの動作をしてもらうためには、「〜するな」よりも「〜するように」言った方が安全です。
- NG例(否定文):
「敬語を使わないでください」 - OK例(肯定文):
「カジュアルな口調で話してください」
また、肯定文にするとプロンプトの目的やトーンも明確になりやすく、誤解が減ります。
| 観点 | 内容 |
|---|---|
| 問題名 | ピンクの象問題(Don’t think of a pink elephant) |
| 人間にも起きる | 否定命令は意識が向いてしまう |
| LLMにも影響 | 否定命令よりも肯定命令の方が安定して意図が伝わる |
| 実践的対応 | 否定命令は避け、肯定的にどう振る舞ってほしいかを明示する |




