web-dev-qa-db-ja.com

ビデオファイルから字幕を抽出するにはどうすればよいですか?

コマンドラインを使用してビデオファイルから字幕を抽出したいのですが。

多くのファイルから字幕を抽出したい。そのため、CLIツールが必要です。

理想的には、埋め込まれた字幕をサポートするあらゆるビデオ形式で動作するはずです。

例えば:

subextract -f RevolutionOS.mp4

Extracting English.srt
Extracting French.srt
Extracting Russina.srt
All subtitles extracted
5
Wally

コンテナのタイプごとに固有のツールがあります(字幕がテキストとして保存され、ビデオストリームに混合されない場合):

具体的には、コマンドラインは次のようになります

MP4Box -srt <trackID> RevolutionOS.mp4

trackIDの可能な値は、以下の出力から推定できます

MP4Box -info RevolutionOS.mp4

ビデオストリームにミックスされる字幕(いわゆるhardsubs)の場合、 [〜#〜] ocr [〜#〜] ソフトウェアが必要です。ここには既製のソリューションがあるようです。たとえば subtitleripper + [〜#〜] gocr [〜#〜] VobSub(DVDの一般的な形式)の場合、それらの経験がなく、どれほど優れているかわかりません。

4