NotebookLMが読み間違えて音声Potcastが残念になるのを防ぐ方法。:覚書

ブログ

ウェブサイトのテキストデータからNotebookLMが音声を生成する際、漢字や固有名詞など読み方が曖昧な部分があると、AIが文脈から推測して読み上げるため、読み間違いが発生することがあります。

NotebookLM の音声概要は、アップロード(または URL 指定)したテキストを Gemini 系 TTS にそのまま渡して合成します。スクリプト生成と音声合成が別プロセスのため、後段で辞書が効かない場合がある。
・HTML 構造やメタ情報はほぼ無視される
・日本語固有名詞や漢字は標準辞書に頼るため、読み分けが不十分

具体的な方法として、以下のような対策が挙げられます。
最も手軽なのは「Customize での読み指定+rubyタグ」
・それでも読めない場合は スクリプトを編集して再アップ

主要な対策 6 つ(実用度順)

#方法ポイント
生成前に「カスタマイズ」欄で読みを明示するAudio Overview 生成ボタン横の Customize に 500 文字までプロンプトを入れられます。例:
「“株式会社”は かぶしきがいしゃ と読みます」「“RAJAR” は レイジャー と読みます」
複数語は箇条書きにすると成功率が高い。Google ヘルプnote(ノート)
ソース側に読み仮名を埋め込むHTML なら <ruby> / <rt> タグ、プレーンテキストなら括弧書き・カナ表記に置換。NotebookLM はタグを剥いでも本文に「かぶしきがいしゃ」が残るため有効。MDN Web Docs
スクリプトを編集して再アップ①②で直らない場合、いったん Audio Overview を生成 → スクリプトをコピー → 読みを phonetic 置換し TXT/PDF にして 新しいノート としてアップロードし直す。Reddit では効果報告多数。Reddit
“発音ガイド”ノートを別ソースとして追加「Notes」で固有名詞一覧+読み方だけを書いたメモを作り、Notebook に添付。生成時に参照されることがある(成功率は ①より低いが再生成時の揺れを抑えられる)。Qiita
文を短く・句読点を適切にTTS は読点・改行でポーズを判断するため、長文を分割し不要な全角空白を除くとイントネーションが安定。
最終手段:外部 TTS で再合成上記でも直らない場合、NotebookLM で「スクリプトのみ」を使い、Google Cloud TTS など SSML 対応エンジンで読み上げ直す。
ワークフロー例(発音精度 90 % 以上を目指す)
  1. 用語リストを作る
    • 固有名詞・略称・難読漢字を抽出
  2. サイト側を編集
    • <ruby> か括弧書きで読みを記載
  3. NotebookLM でノート作成 → Customize に用語リストを貼付
  4. 試しに 1 回生成し、スクリプトを確認
    • 読み残しがあればスクリプトを修正して手順 3 へ戻る
  5. OK なら音声をダウンロード/共有
注意点・限界
  • Customize プロンプトは 500 文字まで(長い用語リストは分割)
  • 2025 年 5 月現在、SSML や IPA(国際音声記号) 直接指定は不可。タグを入れても無視されます。
  • 日本語ベータのため、再生成すると同じ語が別の読みになることがある—完全固定はまだ難しい。
岡山のホームページ作成