「ピンクの象」問題を理解してプロンプトを考える：覚書

これは心理学でも知られる現象で、「ピンクの象を思い浮かべるな」と言われると、逆にピンクの象を思い浮かべてしまうというものです。
→ 人間の脳は、否定文よりも肯定文のイメージを処理しやすい傾向があります。

LLMもこの性質をある程度引き継いでおり、

意図通りに動作しやすい傾向があります。

ChatGPTなどのLLMは、大量のテキストを学習しているため、「禁止命令」や「〜しないで」という表現に出会うことも多くあります。

しかし、以下のような問題があります：

否定命令の例	起こりうる挙動
「絶対に暴力的な表現を使わないでください」	一部の文脈では「暴力的な表現」というトピック自体に反応して出力してしまう場合がある。
「次の文ではジョークを使わないで」	逆にジョークの文体を想起してしまう可能性。

これは「ピンクの象を思い浮かべるな」に似ています。LLMは文中に登場したトピックを重視しがちなため、「使うな」と言っても、その語彙やスタイルに注意が向いてしまいます。

意図通りの動作をしてもらうためには、「〜するな」よりも「〜するように」言った方が安全です。

また、肯定文にするとプロンプトの目的やトーンも明確になりやすく、誤解が減ります。

観点	内容
問題名	ピンクの象問題（Don’t think of a pink elephant）
人間にも起きる	否定命令は意識が向いてしまう
LLMにも影響	否定命令よりも肯定命令の方が安定して意図が伝わる
実践的対応	否定命令は避け、肯定的にどう振る舞ってほしいかを明示する