「ピンクの象」問題を理解してプロンプトを考える:覚書

ブログ

これは心理学でも知られる現象で、「ピンクの象を思い浮かべるな」と言われると、逆にピンクの象を思い浮かべてしまうというものです。
→ 人間の脳は、否定文よりも肯定文のイメージを処理しやすい傾向があります。

LLMもこの性質をある程度引き継いでおり、

  • 「〇〇しないで」と書かれた指示よりも
  • 「〇〇してください」という肯定的な表現の方が

意図通りに動作しやすい傾向があります。

■ LLMにおける「否定命令」の課題

ChatGPTなどのLLMは、大量のテキストを学習しているため、「禁止命令」や「〜しないで」という表現に出会うことも多くあります。

しかし、以下のような問題があります:

否定命令の例起こりうる挙動
「絶対に暴力的な表現を使わないでください」一部の文脈では「暴力的な表現」というトピック自体に反応して出力してしまう場合がある。
「次の文ではジョークを使わないで」逆にジョークの文体を想起してしまう可能性。

これは「ピンクの象を思い浮かべるな」に似ています。LLMは文中に登場したトピックを重視しがちなため、「使うな」と言っても、その語彙やスタイルに注意が向いてしまいます。

■ 実用上のおすすめ:否定文→肯定文への書き換え

意図通りの動作をしてもらうためには、「〜するな」よりも「〜するように」言った方が安全です。

  • NG例(否定文):
     「敬語を使わないでください」
  • OK例(肯定文):
     「カジュアルな口調で話してください」

また、肯定文にするとプロンプトの目的やトーンも明確になりやすく、誤解が減ります。


観点内容
問題名ピンクの象問題(Don’t think of a pink elephant)
人間にも起きる否定命令は意識が向いてしまう
LLMにも影響否定命令よりも肯定命令の方が安定して意図が伝わる
実践的対応否定命令は避け、肯定的にどう振る舞ってほしいかを明示する
岡山のホームページ作成