WAV形式の音声

WAV ファイル形式は、Microsoft と IBM が共同で開発したオーディオ デジタル ストレージの標準であり、AIFF および IFF 形式に非常に近い RIFF ファイル形式構造を採用しています。PIFF Resource Interchange File Format 仕様に準拠しています。すべての WAV には、オーディオ ストリームのエンコード パラメータであるファイル ヘッダーがあります。
マルチメディア アプリケーションでは、ビットマップ、オーディオ データ、ビデオ データ、周辺機器の制御情報など、さまざまな種類のデータが使用されます。RIFF は、これらの種類のデータを格納する方法を提供します. RIFF ファイルに含まれるデータの種類は、ファイルの拡張子によって識別されます. RIFF ファイルに格納できるデータには、次のものが含まれます: Audio Video Interleaved Format Data (.AVI) 、波形
フォーマットデータ(.WAV)、ビットマップフォーマットデータ(.RDI)、MIDIフォーマットデータ(.RMI)、パレットフォーマット(.PAL)、マルチメディアムービー(.RMN)、アニメーションカーソル(.ANI)、その他RIFFファイル( .BND)。

最も基本的な WAVE ファイルは PCM (Pulse Code Modulation) 形式です. このファイルはサンプリングされたサウンド データを圧縮せずに直接格納します. サウンド カードが直接サポートするデータ形式です. サウンド カードで他の圧縮されたサウンド データを正しく再生するには, 圧縮データを PCM 形式に解凍してから、サウンド カードで再生する必要があります。

  • 構造
    1. WAV 形式は Windows/Intel 環境に由来するため、リトルエンディアンのバイト順で格納されます。(java デフォルトはビッグエンディアン)
    2. RIFF ファイルの構造はツリー構造とみなすことができ、その基本構成は「チャンク」と呼ばれる単位で、上部が「RIFF」ブロック、その下の各ブロックが「タイプ ブロック」識別 (オプション)」、「識別子」(4 バイト)、「データ サイズ」(4 バイト)、および「データ」。
    3. 「タイプ ブロック識別子」は、「WAVE」チャンクなどの一部のチャンクでのみ使用されます。これは、その下にネストされた他のチャンクがあることを意味します。「タイプ ブロック識別子」が使用される場合、チャンクには他の項目 (ブロック識別子、データ サイズなど) がなく、ファイルを読み取るときの識別子としてのみ使用されます。最初にこの「タイプブロック識別子」を見つけ、それを開始点として使用して、その下にネストされた他のチャンクを読み取ります。
    4. 非 PCM 形式のファイルは、少なくとももう 1 つの「ファクト」ブロックを追加します。これは、解凍されたデータのサイズを記録するために使用されます (ファイルではなくデータであることに注意してください)。この「事実」ブロックは通常、「データ」ブロックの前に追加されます。
    5. WAVE ファイルは複数のチャンクで構成されます。ファイル内の位置に応じて、RIFF WAVE Chunk、Format Chunk、Fact Chunk (optional)、Data Chunk が含まれます。

おすすめ

転載: blog.csdn.net/shuangmu9768/article/details/125145706