めんどうな字幕編集をAIでやってみる。

ブログ

まだまだ字幕が必要な時があり、Youtubeの字幕も日本語対応は無茶苦茶です。
CapCutは、初心者に使いやすくオートキャプションは手早いですが、誤変換不自然な区切りが出やすく、さらに最後に字幕がズレます。
なので私は、字幕生成をCapCutに任せず、次の手順で安定させることをおすすめしています。

1) 先に動画を仕上げる

まず動画を一通り編集して、尺・カットなどを確定させます。
※字幕は「編集後の確定尺」に合わせるのが前提です。

2) 音声だけを書き出す

編集が終わったら、エクスポートでオーディオファイルのみを書き出します。

3) AIでSRTを作る

書き出した音声データをManasに投入します(私はローカルファイルから入れています)。
ここで、字幕のルールを明確に指定してSRT化させます。


CapCutの問題は「自動で作ること」ではなく、ルールが曖昧なまま作ることなので、先にルールを固定します。

分割ルール(読みやすさ)
  • 文意の通る文節で分割
  • 助詞の直前など、意味が切れる場所で分割しない
文字数ルール(画面に収める)
  • 1字幕:最大2行
  • 1行:全角16文字以内
    超える場合は、文節で改行/次の字幕へ分割
    (※「12文字固定」はやめて、上限運用にします)
時間ルール(速すぎ問題を防ぐ)
  • 1字幕:1.0〜5.0秒
ズレ対策(事故防止)
  • SRT最終行の終了時刻=動画尺に一致させる
  • 一致しない場合は再生成

以下をそのままManasに貼って使えます。

  • 添付の音声から日本語SRTを作成してください。
  • 文意の通る文節で分割してください。
  • 1字幕は最大2行、1行は全角16文字以内。超える場合は文節で改行、または次の字幕へ分割してください。
  • 1字幕の表示時間は1.0〜5.0秒にしてください。
  • SRT最終行の終了時刻が動画尺と一致していることを確認し、ズレがあれば再生成してから出力してください。
  • 出力はSRTのみでお願いします。

それをCapCutにもどしてやてみてください。

岡山のホームページ作成