web-dev-qa-db-ja.com

16ビットwavを8ビットwavに変換するときにノイズが発生するのはなぜですか?それを回避するにはどうすればよいですか?

16ビット/ 8000HZ/Mono/PCM.wavファイルがいくつかあります。電話システムで使用するには8ビットに変換する必要があります。

しかし、変換後、ソースサウンド全体が無音であっても、8ビットの.wavファイルに多くのノイズが表示されることがわかりました。 ( Audacity を使用して無音を生成し、16ビットのMicrosoft WAVにエクスポートしてから、8ビットのMicrosoft WAV(その他の非圧縮ファイル)にエクスポートして、何が起こったかを聞くことができます)。

私はそのような変換を行うために AudacitysoxCoolEdittrial )を試みました、それらはすべて後にノイズを生成します変換。

これはどのように起こったのですか?そして、これを回避する方法はありますか?

3
LiuYan 刘研

あなたが参照しているノイズは ディザ である可能性があります。多くのビットレート変換アルゴリズムは、変換前に信号に低振幅で、多くの場合周波数形状のノイズであるディザを追加します。このノイズは、ほとんどの場合、実際に変換の可聴品質を向上させます。ディザリングが必要ない場合は、アプリケーションの設定でディザリングを無効にできることを願っています。

5
Yetanotherjosh

8ビットの音が聞こえないと、話しているノイズの種類を判断するのは困難ですが、考えられる問題はいくつかあります。

(1)16ビットから8ビットに変換すると、常に一般的な品質の低下が発生します。結局のところ、情報を破棄することになります。

(2)16ビットサンプルが正規化されていない場合(つまり、16ビット範囲全体のごく一部しか使用していない場合)、8ビットに変換すると品質が非常に低くなります-最初に正規化して、変換後に8ビット範囲全体を使用します。

(3)2つの一般的ですが異なる8ビットオーディオ表現があります。符号付き(2の補数)と符号なし(オフセット)で、後者の方が一般的です。間違った形式を使用した場合、つまり、ある形式に変換した後、別の形式を想定して再生しようとすると、音声は認識できますが、かなり悪い音になります。

(4)テレフォニー(音声)アプリケーションの場合、線形ではなく8ビットオーディオに非線形(対数)エンコーディングを使用するのが一般的です。最も一般的な2つは、 A-lawµ-法 。ただし、変換された8ビットオーディオは線形です。 A-lawまたはµ-lawを期待するテレフォニーアプリケーションでリニアPCMを使用しようとしている場合は、歪んだ混乱のように聞こえます。

3
Paul R