インスタント メッセージングのオーディオおよびビデオ開発のためのオーディオ コーデック技術の学習

オーディオ コーデックを学ぶためにどの本を読むべきか、よく聞かれますが、実際には、多くの理由から、これは答えるのが難しい質問です。

    工学をやる上でまず問題になるのは、教科書の学習とは異なり、本を読んでも解決できないということです。
    海外でのオーディオ技術研究全体を含め、中国でオーディオコーデック技術を研究している人はほとんどいません。(中国の海底騒音技術が十分に解決されていないことからもわかる)。
    オーディオ コーデック技術はアプリケーションであり、一般的な書籍は理論的な根拠に関するものです。


理論書を読むだけでは応用が遠すぎて、練習しないと忘れてしまいます。私が最初に本を読んだときも、工学から始まりました.実践的な仕事や個人的な興味の基準をたくさん読んでから、わからないところの論文を探し、知識を補うために本を探しました.典型的な逆学習。通常、大学院生は「教科書→論文を読む→工学をする」という学習方法とプロセスを使用します。

 

本や論文を見つけるには、どのような考え方に従うことができるでしょうか。

オーディオコーデック技術は比較的複雑なアプリケーションであり、特に中国では、通常の本は理論的な本です。オーディオ コーデック技術は、AEC、HRTF などの一般的なオーディオ技術とは異なり、後者はそれぞれ音声とオーディオのアプリケーション技術であり、特定のアプリケーション技術と言うべきであり、比較的言えば、情報の検索が容易です。 .

具体的には、オーディオコーデック技術も特定のアプリケーション技術ですが、システムは比較的複雑で、目的は比較的基本的なものです。これはソース コーデック テクノロジの一分野であり、その目的はデータを圧縮することです。

では、オーディオ コーデック テクノロジにはどのような側面があるのでしょうか。ソースコーディング技術(Source Coding Technology)ですので、ソースコーディング技術に関する本を理論的な根拠として読むことができます。

さらに、私はオーディオ コーデック技術を、EQTPM と呼ばれる 5 つの主要な技術に分けています。E エントロピー コーディング、Q 量子化コーディング、T 変換コーディング、P 予測コーディング、M オーディオ モデリング (知覚モデリング、BCC モデリング、正弦波モデリングなど)。それに対して、勉強するときは、これらの技術に基づいて関連書籍を参照して学習することができます。インスタント メッセージング チャット ソフトウェア アプリの開発は、Wei Keyun の v: weikeyun24 相談を追加できます。

 

中国ではワイドバンド オーディオ コーデックに関する本はほとんどないため、EQTP テクノロジについても説明している音声コーデックに関する本を読むことができます。例:「音声処理技術」、「音声符号化」、「低ビットレート音声符号化」、「デジタル音声符号化の原理」、「可変レート音声符号化」、「低レート音声符号化」、「デジタル音声符号化」、 「データ圧縮」。

「JPEG2000 画像圧縮の基礎」: この本は良い本だと思います。

「情報理論とコーディング」、「信号とシステム」、および高度な数学、それらをリストするだけでなく、頻繁に繰り返します。

たとえば、ANDREAS SPANIAS の「Audio Signal Processing and Coding」は非常に古典的だと思います。彼の 63 ページの論文「デジタル オーディオの知覚コーディング」。

他に読むべき本は次のとおりです。

    MP3 の父 - K. ブランデンバーグ:
    「オーディオと音響へのデジタル信号処理の応用」
    「デジタル オーディオとコンピュータ音楽への応用を含むデジタル信号処理の入門書」
    「聴覚と MPEG オーディオ標準」
    「基礎と進化」 of Standardized Coders (Wiley, 2003)(ISBN 0471373125)(578s)"
    ハンブルク連邦国防軍大学の Udo Zolzer 教授:
    "Digital Audio Signal Processing"
    "High-Fidelity Multichannel Audio Coding"
    "Speech Coding Algorithms"

SPANIAS の本を読むことを強くお勧めします。少なくとも SPANIAS の論文をよく見てください。これは、オーディオコーディングを理解するのに大いに役立ちます。でも、耳に関する生理学的な言葉がたくさん出てくるので、辞書を持ってゆっくりと目を通す必要があります。私はこの論文に飽き飽きしており、多くの恩恵を受けてきました。

以下の本は体系的に読んだわけではありませんが、いずれもPDF版があり、たまに目を通しています。これらの古典的な本を理解するのに多くの時間を費やさないため、一見するとすべてが同じように話されているように錯覚しますが、実際に理解すると、それらはさまざまな詳細の精緻化であることがわかります.

特別な専門書:

    「Adaptive Signal Processing」など、オーディオ コーディングやその他のオーディオ技術のために、適応技術がよく使用されます。
    例: 可逆コーディング Wavpack、MPEG4 ALS は、どちらも適応技術を使用しています。
    フィルター設計に関する書籍。
    「マルチサンプリング レート デジタル信号処理理論とその応用」: トランスフォーム技術について説明します。
    QMF を使用する HE-AAC および ATRAC3、
    PQF
    AAC を使用する MP3、MDCT を使用する MP3、
    TDAC (MDCT) を使用する AC3
    WMA および G722.1 (MLT)


だからこそ、これらの変換ツールを選択してください。違いは何ですか。Vaidyananthan PP の本を参照していただけると、より役立つと思います。

おすすめ

転載: blog.csdn.net/weikeyuncn/article/details/128384688