web-dev-qa-db-ja.com

特定のオーバーラップ期間を持つ複数の短いオーディオMP3ファイルを連結する方法

単語の音節を含む、1秒のように非常に短い傾向のあるMP3ファイルがあります。オーバーラップさせたい(1つの終わりが次の始まりとマージされる)。クロスフェードに関するいくつかのトピックを見つけましたが、それが必要かどうかはわかりません(クロスフェード)。つまり、1つのボリュームを下げ、次のトピックに移行するときにボリュームを上げる必要があります。現時点では、オーディオをマージするだけで十分だと思います。

重なりはマイクロ秒のオーダーである必要があります。 FFmpegのオプションの中には秒の小数があります。現在、私はたくさんの短いMP3を次のものと連結しています。

_    /// <summary>
    /// <para/>20170114
    /// </summary>
    /// <returns></returns>
    public void ConcatMP3s(String InFiles, String OutputFile)
    {
        // http://superuser.com/questions/87040/how-to-stich-mp3s-together-with-ffmpeg
        var _IN_PARAMS = " -f concat ";
        var _IN_FILES = "-safe 0 -i " + DQuote(InFiles);
        var _OUT_PARAMS = " -c copy -y ";  // -y to overwrite the output file
        var _OUT_FILE = DQuote(OutputFile);
        //
        var _FFMPEG_ARGS = _IN_PARAMS + _IN_FILES + _OUT_PARAMS + _OUT_FILE;
        //return _FFMPEG_ARGS;
        //
        RunFFmpeg(_FFMPEG_ARGS);
    }
_

一度に複数のファイルを連結するコマンドまたはテクニックが欲しいのですが、2つのファイルに対してそれを行う方法を教えていただければ、それらすべてをループすることができます。それは醜いですが受け入れられる答えです:)。

@Mulvya、あなたのリンクから私がつかむことができるのは、次のFFmpegコマンドライン構造です(すべて1つのコマンドライン文字列に)

_ffmpeg -i 1.mp3 -i 2.mp3 -i 3.mp3 -i 4.mp3
   -filter_complex
     "[1]adelay=delay1|delay1[b];
      [2]adelay=delay2|delay2[c];
      [3]adelay=delay3|delay3[d];
      [0][b][c][d]amix=4"
merged.mp3
_

Delay1、delay2、delay3は何である必要がありますか?それらは、それぞれ_1.mp3_、_2.mp3_、および_3.mp3_のミリ秒単位の期間ですか?

これらの期間を取得するための最良の方法は何ですか?たとえば、ファイルシステムファイルのプロパティは正確ですか?

[b]、[c]、[d]の文字は任意ですか?チャネル名?生成する必要がありますか?

たとえば、_1.mp3_と_2.mp3_、2と3、次に3と4の間で10ミリ秒のオーバーラップを指定するにはどうすればよいですか?

または、delay1、delay2、delay3から10ミリ秒を引く必要がありますか?

追加:これは、プログラムで達成しようとしていることを説明するためにまとめた手動モンタージュのスナップショットです(一定のオーバーラップを想定しています。ここでは約100ミリ秒を試しています)。上記のdelay1、delay2、delay3の値を説明してください。

snapshot of a manual montage

FFmpeg出力からのMP3持続時間は、それぞれ550、440、500、960、440ミリ秒です。

========= FFmpegからの電流出力

__VDO\FFmpeg 20160310\bin\FFmpeg -i "S:\_W\ARP_WEB\SRC\SND\A4_23\1\01.mp3" -i "S:\_W\ARP_WEB\SRC\SND\A2\1\22.mp3" -i "S:\_W\ARP_WEB\SRC\SND\A2\3\23.mp3" -i "S:\_W\ARP_WEB\SRC\SND\A3\1\24.mp3" -i "S:\_W\ARP_WEB\SRC\SND\A2\2\03.mp3" -filter_complex "[1]adelay=279[b];[2]adelay=592[c];[3]adelay=916[d];[4]adelay=1712[e]; [0][b][c][d][e]amix=5" -y "S:\_W\ARP\AMSSTUDIO\SRC\DATA\FFMPEG\DEBUG Concat with Overlap\OUT.MP3"_

ffmpeg version N-79000-g66edd86 Copyright (c) 2000-2016 the FFmpeg developers built with gcc 5.3.0 (GCC) configuration: --enable-gpl --enable-version3 --disable-w32threads --enable-avisynth --enable-bzlib --enable-fontconfig --enable-frei0r --enable-gnutls --enable-iconv --enable-libass --enable-libbluray --enable-libbs2b --enable-libcaca --enable-libdcadec --enable-libfreetype --enable-libgme --enable-libgsm --enable-libilbc --enable-libmodplug --enable-libmfx --enable-libmp3lame --enable-libopencore-amrnb --enable-libopencore-amrwb --enable-libopenjpeg --enable-libopus --enable-librtmp --enable-libschroedinger --enable-libsnappy --enable-libsoxr --enable-libspeex --enable-libtheora --enable-libtwolame --enable-libvidstab --enable-libvo-amrwbenc --enable-libvorbis --enable-libvpx --enable-libwavpack --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxavs --enable-libxvid --enable-libzimg --enable-lzma --enable-decklink --enable-zlib libavutil 55. 19.100 / 55. 19.100 libavcodec 57. 28.100 / 57. 28.100 libavformat 57. 28.100 / 57. 28.100 libavdevice 57. 0.101 / 57. 0.101 libavfilter 6. 39.102 / 6. 39.102 libswscale 4. 0.100 / 4. 0.100 libswresample 2. 0.101 / 2. 0.101 libpostproc 54. 0.100 / 54. 0.100 [mp3 @ 0000000000584ba0] Estimating duration from bitrate, this may be inaccurate Input #0, mp3, from 'S:\_W\ARP_WEB\SRC\SND\A4_23\1\01.mp3': Duration: 00:00:00.55, start: 0.000000, bitrate: 320 kb/s Stream #0:0: Audio: mp3, 44100 Hz, mono, s16p, 320 kb/s [mp3 @ 00000000005a2a20] Estimating duration from bitrate, this may be inaccurate Input #1, mp3, from 'S:\_W\ARP_WEB\SRC\SND\A2\1\22.mp3': Duration: 00:00:00.44, start: 0.000000, bitrate: 320 kb/s Stream #1:0: Audio: mp3, 44100 Hz, mono, s16p, 320 kb/s [mp3 @ 000000000058af00] Estimating duration from bitrate, this may be inaccurate Input #2, mp3, from 'S:\_W\ARP_WEB\SRC\SND\A2\3\23.mp3': Duration: 00:00:00.50, start: 0.000000, bitrate: 320 kb/s Stream #2:0: Audio: mp3, 44100 Hz, mono, s16p, 320 kb/s [mp3 @ 000000000058cb80] Estimating duration from bitrate, this may be inaccurate Input #3, mp3, from 'S:\_W\ARP_WEB\SRC\SND\A3\1\24.mp3': Duration: 00:00:00.96, start: 0.000000, bitrate: 127 kb/s Stream #3:0: Audio: mp3, 44100 Hz, mono, s16p, 128 kb/s [mp3 @ 00000000005c5c00] Estimating duration from bitrate, this may be inaccurate Input #4, mp3, from 'S:\_W\ARP_WEB\SRC\SND\A2\2\03.mp3': Duration: 00:00:00.44, start: 0.000000, bitrate: 320 kb/s Stream #4:0: Audio: mp3, 44100 Hz, mono, s16p, 320 kb/s Output #0, mp3, to 'S:\_W\ARP\AMSSTUDIO\SRC\DATA\FFMPEG\DEBUG Concat with Overlap\OUT.MP3': Metadata: TSSE : Lavf57.28.100 Stream #0:0: Audio: mp3 (libmp3lame), 44100 Hz, mono, fltp (default) Metadata: encoder : Lavc57.28.100 libmp3lame Stream mapping: Stream #0:0 (mp3) -> amix:input0 Stream #1:0 (mp3) -> adelay Stream #2:0 (mp3) -> adelay Stream #3:0 (mp3) -> adelay Stream #4:0 (mp3) -> adelay amix -> Stream #0:0 (libmp3lame) Press [q] to stop, [?] for help Error while filtering: Cannot allocate memory size= 5kB time=00:00:00.54 bitrate= 70.2kbits/s speed=42.3x video:0kB audio:4kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 4.938003%

3
Meryan

次の形式のコマンドを使用します

ffmpeg -i 1.mp3 -i 2.mp3 -i 3.mp3 -i 4.mp3
   -filter_complex
     "[1]adelay=delay1|delay1[b];
      [2]adelay=delay2|delay2[c];
      [3]adelay=delay3|delay3[d];
      [0][b][c][d]amix=4"
merged.mp3

ミリ秒単位の各delayNは、オーディオストリームの開始からのオーディオの開始オフセットです。したがって、file2を最終ミックスの14.2秒で開始する場合は、ステレオ入力にadelay=14200|14200を使用します。モノラル入力にはadelay=14200を使用できます。スクリーンショットでは、これらは開始列の値です。

ラベルパッド[a] ..etcは任意であり、フィルターの出力に割り当てられるため、後で他のフィルターで使用したり、出力用にマップしたりできます。各パッドは1回消費できます。それらは英数字ですが、ffmpegは入力ファイルを参照するためにそれらを使用するため、[2]のような純粋な整数の割り当ては避けてください。

1
Gyan