統合ディスプレイはハードウェア エンコードも可能: Intel SDK && さまざまなオーディオおよびビデオ コーデックの学習詳細

転載元: https://www.shuzhiduo.com/A/6pdDplDDdw/
http://blog.sina.com.cn/s/blog_4155bb1d0100soq9.html

INTEL MEDIA SDK は、内蔵ディスプレイ コアに基づいて INTEL が発表したコーデック テクノロジであり、高解像度ビデオの再生時にこのハード デコードの恩恵を受け、CPU 使用率を大幅に削減します。デコードだけでなく、ハードウェアエンコード(SDK HARDWARE)やソフトウェアエンコード(SDK SOFTWARE)といったエンコード機能も備えているのですが、インテルのこの技術はどれほどの実力があるのでしょうか?

国内最新のTMPGEnc Video Mastering Works 5のエンコードエンジンは、それぞれINTEL MEDIA SDKとX264を呼び出すことができるので、テストしてみましょう。

1 ソフトウェア: TMPGEnc Video Mastering Works 5 バージョン: 5.0.6.38 (内蔵 X264 はすでに最新の 114 バージョンです) 2
テスト コンピューター: i3-2100 H67 マザーボード セット ディスプレイ 64 ビット WIN7 Professional Edition

3 つのソース ビデオ: WIN7 に付属するサンプル ビデオ「Wild Animals」の仕様は次のとおりです。

以下に示すように、4 つの X264、SDK ハードウェア エンコーディング、SDK ソフトウェア エンコーディング設定が H264+AAC MKV ファイルとして出力されます。

5 つのテスト結果:

X264 エンコード時間: 55 秒 ファイルサイズ: 14.4M

SDKハードウェアエンコード時間:16秒 ファイルサイズ:14.8M

SDKソフトウェアエンコード時間:2分26秒 ファイルサイズ:14.7M

エンコードされた MKV ファイルをコンピュータで再生すると、ビデオ品質に明らかな違いはありません。

INTEL の SDK ハードウェア エンコード テクノロジは非常に強力で、エンコード効率を大幅に向上させることができるため、採用する価値があるようです。同時に、その性能を最大限に活かしたソフトウェアTMPGEnc Video Mastering Works 5に感謝します。

コーデック学習メモ(1): 基本概念

媒体业务是网络的主要业务之间。尤其移动互联网业务的兴起,在运营商和应用开发商中,媒体业务份量极重,其中媒体的编解码服务涉及需求分析、应用开发、释放license收费等等。最近因为项目的关系,需要理清媒体的codec,比较搞的是,在豆丁网上看运营商的规范 标准,同一运营商同样的业务在不同文档中不同的要求,而且有些要求就我看来应当是历史的延续,也就是现在已经很少采用了。所以豆丁上看不出所以然,从 wiki上查。中文的wiki信息量有限,很短,而wiki的英文内容内多,删减版也减肥得太过。我在网上还看到一个山寨的中文wiki,长得很像,红色的,叫“天下维客”。wiki的中文还是很不错的,但是阅读后建议再阅读英文。

我对媒体codec做了一些整理和总结,资料来源于wiki,小部分来源于网络博客的收集。网友资料我们将给出来源。如果资料已经转手几趟就没办法,雁过留声,我们只能给出某个轨迹。

基本概念

编解码

编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将 信号或者数据流进行编码(通常是为了传输、存储或者加密)或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作。编解码器经常用在视频会议和流媒体等应用中。

容器

很多多媒体数据流需要同时包含音频数据和视频数据,这时通常会加入一些用于音频和视频数据同步的元数据,例如字幕。这三种数据流可能会被不同的程序,进程或者硬件处理,但是当它们传输或者存储的时候,这三种数据通常是被封装在一起的。通常这种封装是通过视频文件格 式来实现的,例如常见的*.mpg, *.avi, *.mov, *.mp4, *.rm, *.ogg or *.tta. 这些格式中有些只能使用某些编解码器,而更多可以以容器的方式使用各种编解码器。

FourCC の正式名は Four-Character Codes で、4 文字 (4 バイト) で構成されています。4 バイトの独立してマークされたビデオ データ ストリーム フォーマットです。これを説明するために、wav および avi ファイルに FourCC のセクションがあります。 AVI ファイル。エンコードに使用されるコーデックの種類。そのため、wavやaviには「IDP3」に相当するFourCCが多数存在します。

ビデオは現在、コンピュータのマルチメディア システムの重要な部分です。ビデオを保存するニーズを満たすために、ビデオとオーディオを 1 つのファイルにまとめて同時再生を容易にするために、さまざまなビデオ ファイル形式を設定することが行われています。ビデオ ファイルは実際には、さまざまなトラックがラップされたコンテナであり、使用されるコンテナの形式はビデオ ファイルのスケーラビリティに関係します。

パラメータの紹介

サンプリングレート

サンプリング レート (サンプリング速度またはサンプリング周波数とも呼ばれる) は、連続信号から抽出されて離散信号を形成する 1 秒あたりのサンプル数を定義し、ヘルツ (Hz) で表されます。サンプリング周波数の逆数は、サンプリング周期またはサンプリング時間と呼ばれ、サンプル間の時間間隔です。サンプル レートとビット レート (「ビット レート」とも呼ばれます) を混同しないように注意してください。

サンプリング定理では、サンプリング周波数はサンプリングされる信号の帯域幅の 2 倍より大きくなければならないと述べており、もう 1 つの同等の記述は、ナイキスト周波数はサンプリングされる信号の帯域幅より大きくなければならないというものです。信号の帯域幅が 100Hz の場合、エイリアシングを避けるためにサンプリング周波数は 200Hz より大きくなければなりません。言い換えれば、サンプリング周波数は信号内の最大周波数成分の周波数の少なくとも 2 倍である必要があり、そうでないと信号サンプルから元の信号を復元できません。

音声サンプルの場合:

8,000 Hz - 电话所用采样率, 对于人的说话已经足够
11,025 Hz
22,050 Hz - 无线电广播所用采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
44,100 Hz - 音频 CD, 也常用于 MPEG-1 音频(VCD, SVCD, MP3)所用采样率
47,250 Hz - Nippon Columbia (Denon)开发的世界上第一个商用 PCM 录音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50,000 Hz - 二十世纪七十年代后期出现的 3M 和 Soundstream 开发的第一款商用数字录音机所用采样率
50,400 Hz - 三菱 X-80 数字录音机所用所用采样率
96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、Blu-ray Disc(蓝光盘)音轨、和 HD-DVD (高清晰度 DVD)音轨所用所用采样率
2.8224 MHz - SACD、 索尼 和 飞利浦 联合开发的称为 Direct Stream Digital 的 1 位 sigma-delta modulation 过程所用采样率。
  在模拟视频中,采样率定义为帧频和场频,而不是概念上的像素时钟。图像采样频率是传感器积分周期的循环速度。由于积分周期远远小于重复所需时间,采样频率可能与采样时间的倒数不同。

50 Hz - PAL ビデオ
60 / 1.001 Hz - NTSC ビデオ
  アナログ ビデオをデジタルに変換する場合、異なるサンプリング プロセスが発生し、今回はピクセル周波数が使用されます。一般的なピクセル サンプリング レートは次のとおりです。

13.5 MHz - CCIR 601、D1 ビデオ
解像度

解像度は一般に、測定または表示システムが細部を区別できる能力を指します。この概念は、時間や空間などの分野で測定できます。日常言語における解像度は、主に画像を鮮明にするために使用されます。解像度が高いほど画質が良くなり、より詳細な部分を表示できます。ただし、比較的多くの情報が記録されるため、ファイルのサイズは大きくなります。現在、パソコン内の画像は画像処理ソフトを利用して画像のサイズを調整したり、写真を編集したりすることができます。Photoshop、Photoimpact、その他のソフトウェアなど。

画像解像度:

これは、画像の詳細を区別する能力を説明するために使用され、デジタル画像、フィルム画像、その他の種類の画像にも適用できます。一般的に「線/ミリメートル」、「線/インチ」などが測定に使用されます。通常、「解像度」は640×480など、各方向のピクセル数で表されます。場合によっては、「1 インチあたりのピクセル数」(pixels per inch、ppi) と、グラフィックの長さと幅を同時に表すこともできます。72ppi、8x6インチなど。

ビデオ解像度:

さまざまなテレビの仕様解像度比較動画の画面サイズを「解像度」といいます。デジタル ビデオはピクセル単位で測定されますが、アナログ ビデオは水平走査線で測定されます。SDTV の解像度は 720/704/640x480i60 (NTSC) または 768/720x576i50 (PAL/SECAM) です。新しい高品位テレビ (HDTV) の解像度は 1920x1080p60 に達します。つまり、各水平走査線は 1920 ピクセル、各画面には 1080 本の走査線があり、1 秒あたり 60 フレームの速度で再生できます。

フレームレートfps

フレーム レートは中国語で「画像更新レート」または「フレーム レート」と訳されることが多く、ビデオ形式で 1 ​​秒あたりに再生される静止画像の数を指します。一般的な画像のリフレッシュ レートは、初期の 6 または 8 フレーム/秒 (フレーム/秒、略して fps) から、現在では 120 フレーム/秒までの範囲です。PAL (ヨーロッパ、アジア、オーストラリアなどのテレビ放送形式) および SECAM (フランス、ロシア、一部のアフリカなどのテレビ放送形式) では更新レートが 25fps であると規定されているのに対し、NTSC (米国のテレビ放送形式) 、カナダ、日本などの形式)では、更新レート 29.97 fps が指定されています。映画フィルムは少し遅い 24fps で撮影されるため、各国のテレビ放送で映画を放送する場合、複雑な変換手順 (テレシネ変換を参照) が必要になります。最も基本的な持続効果を実現するには、約 10fps が必要です。

圧縮方法

非可逆圧縮および可逆圧縮

ビデオ圧縮における非可逆 (Lossy) と可逆 (Lossless) の概念は、基本的に静止画像の概念と似ています。可逆圧縮とは、圧縮前と解凍後のデータがまったく同じであることを意味します。ほとんどの可逆圧縮では、RLE ランレングス エンコード アルゴリズムが使用されます。非可逆圧縮とは、解凍されたデータが非圧縮データと一致しないことを意味します。圧縮プロセス中に、人間の目や耳に敏感ではない一部の画像または音声情報が失われ、失われた情報を回復することはできません。ほとんどすべての高圧縮アルゴリズムは、低データ レートの目標を達成するために非可逆圧縮を使用します。データ損失率は圧縮率に関係しており、圧縮率が小さいほど失われるデータが多くなり、一般的に解凍効果は悪くなります。さらに、一部の非可逆圧縮アルゴリズムでは圧縮を複数回繰り返すため、追加のデータ損失が発生する可能性があります。

WAV、PCM、TTA、FLAC、AU、APE、TAK、WavPack (WV) などの
ロスレス形式 MP3、Windows Media Audio (WMA)、Ogg Vorbis (OGG)、AAC
イントラおよびインター圧縮などの非可逆形式

フレーム内圧縮は空間圧縮とも呼ばれます。画像のフレームを圧縮するとき、隣接するフレーム間の冗長情報は考慮せずに、このフレームのデータのみが考慮されます。これは実際には静止画像の圧縮に似ています。一般に非可逆圧縮アルゴリズムはフレーム単位で使用されますが、フレーム内圧縮ではフレーム間の関係がないため、圧縮されたビデオデータをフレーム単位で編集することができます。一般に、フレーム内圧縮では、それほど高い圧縮率は達成されません。

フレーム間 (フレーム間) 圧縮の使用は、多くのビデオやアニメーションの連続する 2 つのフレームに大きな相関がある、または前後 2 つのフレームの情報がほとんど変化しないという事実に基づいています。つまり、連続した映像は隣接するフレーム間に冗長な情報が存在するため、隣接するフレーム間の冗長性を圧縮するとさらに圧縮量が増加し、圧縮率が低下する。フレーム間圧縮は時間圧縮とも呼ばれ、異なるフレーム間のデータを時間軸上で比較することで圧縮を行います。フレーム間圧縮は通常、可逆圧縮です。フレーム差分アルゴリズムは代表的な時間圧縮方式で、このフレームと隣接するフレームの差分を比較することで、そのフレームと隣接するフレームの差分のみを記録するため、データ量を大幅に削減できます。

対称エンコーディングと非対称エンコーディング

対称性は圧縮コーディングの重要な機能です。対称とは、圧縮と解凍が同じ計算能力と時間を占有することを意味します。対称アルゴリズムは、ビデオのリアルタイム圧縮と送信に適しています。ビデオ会議アプリケーションの場合は、対称圧縮コーディング アルゴリズムを使用することをお勧めします。電子出版やその他のマルチメディア アプリケーションでは、通常、ビデオは事前に圧縮されてから再生されるため、非対称エンコーディングを使用できます。非対称または非対称とは、圧縮には多くの処理能力と時間がかかり、解凍にはより優れたリアルタイム再生、つまり異なる速度での圧縮と解凍が必要であることを意味します。一般に、ビデオを再生 (解凍) するよりも圧縮する方がはるかに時間がかかります。たとえば、3 分のビデオ クリップを圧縮するには 10 分以上かかる場合がありますが、クリップのリアルタイム再生時間はわずか 3 分です。

Wiki 以外のソース: http://tech.lmtw.com/csyy/Using/200411/3142.html

编解码学习笔记(二):codec类型
资料(港台将information翻译为资料)压缩是透过去除资料中的冗余资讯而达成。就视讯资料而言,资料中的冗余资讯可以分成四类:

时间上的冗余资讯(temporal redundancy)
  在视讯资料中,相邻的帧(frame)与帧之间通常有很强的关连性,这样的关连性即为时间上的冗余资讯。这即是上一次学习中的帧间压缩。

空间上的冗余资讯(spatial redundancy)
  在同一张帧之中,相邻的像素之 间通常有很强的关连性,这样的关连性即为空间上的冗余资讯。这即是上一次学习中的帧内压缩。

统计上的冗余资讯(statistical redundancy)
  统计上的冗余资讯指的是欲编码的符号(symbol)的机率分布是不均匀(non-uniform)的。

感知上的冗余资讯(perceptual redundancy)
  感知上的冗余资讯是指在人在观看视讯时,人眼无法察觉的资讯。

视讯压缩(英文:Video compression)是指运用资料压缩技术将数位视讯资料中的冗余资讯去除,降低表示原始视讯所需的资料量,以便视讯资料的传输与储存。实际上,原始视讯资料的资料量往往过大,例如未经压缩的电视品质视讯资料的位元率高达216Mbps,绝大多数的应用无法处理如此庞大的资料量,因此视讯压缩是必要的。目前最新的视讯编码标准为ITU-T视讯编码专家组(VCEG)和ISO/IEC动态图像专家组(MPEG)联合组成的联合视讯组(JVT,Joint Video Team)所提出的H.264/AVC。

典型的なビデオ エンコーダ: 現在の信号をエンコードするとき、エンコーダはまず、予測信号と呼ばれる現在の信号を予測する信号を生成します。予測方法は、時間的予測 (インター予測)、つまり前の信号を使用することもできます。フレーム予測、または空間予測 (イントラ予測)、つまり同じフレーム内の隣接するピクセルの信号を予測に使用します。エンコーダは、予測信号を取得した後、予測信号から現在の信号を減算して残差信号(残差信号)を取得し、残差信号のみを符号化することで、時間的または空間的な冗長性の一部を除去することができます。 。次に、エンコーダは残差信号を直接エンコードするのではなく、まず残差信号を変換 (通常は離散コサイン変換) し、次に量子化して空間的および知覚的な冗長情報をさらに除去します。量子化後に得られた量子化係数は、統計的な冗長情報を除去するためにエントロピー符号化されます。

ビデオコーディング標準の開発

標準

組織を策定する

著作権保護を解除
(DRMフリー)

メインアプリケーション

1984年

H.120

IT-T

はい

1990年

H.261

IT-T

はい

ビデオ会議、ビデオ通話

1993年

MPEG-1 パート 2

ISO/IEC

はい

ビデオ CD (VCD)

1995年

H.262/MPEG-2 パート 2

ISO/IEC、ITU-T

いいえ

DVD ビデオ、ブルーレイ、DVB、SVCD

1996年

H.263 [6]

IT-T

ビデオ会議、ビデオ通話、3G モバイル ビデオ (3GP)

1999年

MPEG-4 パート 2

ISO/IEC

いいえ

2003年

H.264/MPEG-4 AVC [1]

ISO/IEC、ITU-T

いいえ

ブルーレイ (Blu-Ray) ビデオ ディスク、デジタル ビデオ放送 (DVB)、iPod ビデオ、高品位 DVD (HD DVD)

一般的なコーデックについては、以下の表を参照してください。これについては、次のカテゴリで説明します。

ビデオコーデック

ISO/IEC

MJPEG・Motion JPEG 2000・MPEG-1・MPEG-2(パート2)・MPEG-4(パート2/ASP・パート10/AVC)・HVC

IT-T

H.120・H.261・H.262・H.263・H.264・H.265

他の

AMV · AVS · Bink · CineForm · Cinepak · Dirac · DV · Indeo · Microsoft Video 1 · OMS Video · Pixlet · RealVideo · RTVideo · SheerVideo · Smacker · Sorenson Video & Sorenson Spark · Theora · VC-1 · VP3 · VP6 · VP7・VP8・WMV

オーディオコーデック

ISO/IECMPEG

MPEG-1 レイヤー III (MP3) · MPEG-1 レイヤー II · MPEG-1 レイヤー I · AAC · HE-AAC · MPEG-4 ALS · MPEG-4 SLS · MPEG-4 DST

IT-T

G.711 · G.718 · G.719 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 · G.729.1

他の

AC-3・AMR・AMR-WB・AMR-WB+・Apple Lossless・ATRAC・DRA・DTS・FLAC・GSM-HR・GSM-FR・GSM-EFR・iLBC・Monkey's Audio・TTA(True Audio)・MT9・μ-law · Musepack · Nellymoser · OptimFROG · OSQ · RealAudio · RTAudio · SD2 · SHN · SILK · Siren · Speex · TwinVQ · Vorbis · WavPack · WMA

画像圧縮

ISO/IEC/ITU-T

JPEG · JPEG 2000 · JPEG XR · ロスレスJPEG · JBIG · JBIG2 · PNG · WBMP

その他

APNG・BMP・DjVu・EXR・GIF・ICER・ILBM・MNG・PCX・PGF・TGA・TIFF

メディアコンテナ

普遍的な

3GP · ASF · AVI · Bink · BXF · DMF · DPX · EVO · FLV · GXF · M2TS · Matroska · MPEG-PS · MPEG-TS ·MP4 · MXF · Ogg · QuickTime · RealMedia · RIFF · Smacker · VOB

音声のみ

AIFF・AU・WAV

上の表については、中国語の wiki で特定のコーデックを検索できますが、英語の wiki の方が情報が豊富です。下の表を参照してください。

マルチメディア圧縮フォーマット

ビデオ圧縮

ISO/IEC

MJPEG・Motion JPEG 2000・MPEG-1・MPEG-2(パート2)・MPEG-4(パート2/ASP・パート10/AVC)・HEVC

IT-T

H.120・H.261・H.262・H.263・H.264・HEVC

その他

AMV · AVS · Bink · CineForm · Cinepak · Dirac · DV · Indeo · Microsoft Video 1 · OMS Video · Pixlet · RealVideo · RTVideo · SheerVideo · Smacker · Sorenson Video & Sorenson Spark · Theora · VC-1 · VP3 · VP6 · VP7・VP8 ・WMV

音声圧縮

ISO/IEC

MPEG-1 レイヤー III (MP3) ・ MPEG-1 レイヤー II ・ MPEG-1 レイヤー I ・ AAC ・ HE-AAC ・ MPEG-4 ALS ・ MPEG-4 SLS ・ MPEG-4 DST ・ MPEG-4 HVXC ・ MPEG-4セルプ

IT-T

G.711 · G.718 · G.719 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 · G.729.1

その他

AC-3・AMR・AMR-WB・AMR-WB+・Apple Lossless・ATRAC・DRA・DTS・FLAC・GSM-HR・GSM-FR・GSM-EFR・iLBC・Monkey's Audio・TTA(True Audio)・MT9・μ-law · Musepack ·Nellymoser · OptimFROG · OSQ · RealAudio · RTAudio · SD2 · SHN · SILK · Siren · Speex · TwinVQ · Vorbis · WavPack · WMA

画像圧縮

ISO/IEC/ITU-T

JPEG · JPEG 2000 · JPEG XR · ロスレスJPEG · JBIG · JBIG2 · PNG · WBMP

その他

APNG・BMP・DjVu・EXR・GIF・ICER・ILBM・MNG・PCX・PGF・TGA・QTVR・TIFF

メディアコンテナ

ISO/IEC

MPEG-PS・MPEG-TS・MPEG-4 Part 12 /JPEG 2000 Part 12・MPEG-4 Part 14

IT-T

H.222.0

その他

3GP および 3G2 · ASF · AVI · Bink · DivX メディア フォーマット · DPX · EVO · Flash ビデオ · GXF · M2TS ·Matroska · MXF · Ogg · QuickTime · RealMedia · REDCODE RAW · RIFF · Smacker · MOD および TOD · VOB · WebM

音声のみ

AIFF・AU・WAV

コーデック学習記(3):Mpegシリーズ - Mpeg 1とMpeg 2
MPEGとは、Moving Picture Experts Groupの略です。この名前の本来の意味は、ビデオとオーディオのコーディング標準を研究するグループを指します。現在、MPEG と呼ばれるものは、一般にこのグループによって策定された一連のビデオ符号化規格を指します。このグループは 1988 年に結成され、これまでに MPEG-1、MPEG-2、MPEG-3、MPEG-4、MPEG-7 などの複数の規格を策定しており、現在 MPEG-21 が策定されています。

MPEG はこれまでに次のビデオ関連規格を開発し、現在も開発中です。

MPEG-1: 最初の公式ビデオおよびオーディオ圧縮規格。後にビデオ CD に採用されました。MP3 と呼ばれる第 3 レベルのオーディオ圧縮 (MPEG-1 Layer 3) は、より一般的なオーディオ圧縮形式になりました。
MPEG-2: 放送品質のビデオ、オーディオ、およびトランスポート プロトコル。ワイヤレス デジタル TV - ATSC、DVB、ISDB、デジタル衛星 TV (DirecTV など)、デジタル ケーブル TV 信号、DVD-Video ディスク テクノロジで使用されます。
MPEG-3: 当初の目標は高品位テレビ (HDTV) 用に設計することでしたが、HDTV アプリケーションには MPEG-2 で十分であることが判明したため、MPEG-3 の開発は中止されました。
MPEG-4: 2003 年にリリースされたビデオ圧縮規格。主に MPEG-1、MPEG-2、およびその他の規格を拡張して、ビデオ/オーディオ「オブジェクト」エンコーディング、3D コンテンツ、低ビット レート エンコーディング (低ビットレート エンコーディング)、デジタル著作権をサポートします。管理 (デジタル著作権管理)。パート 10 は ISO/IEC と ITU-T によって共同発行され、H.264/MPEG-4 パート 10 と呼ばれます。H.264を参照してください。
MPEG-7: MPEG-7 はビデオ圧縮規格ではなく、マルチメディア コンテンツ記述規格です。
MPEG-21: MPEG-21 は開発中の標準であり、その目標は将来のマルチメディア アプリケーションに完全なプラットフォームを提供することです。
  上の図に示すように、メディア コーデックは MPEG-1、MPEG-2、MPEG-4 です。

写真の名前の説明: 地球上の誰もが写真の DVD を知っていますが、DVB とは何ですか?

DVB: デジタル ビデオ ブロードキャスト (DVB、デジタル ビデオ ブロードキャスト) は、「DVB プロジェクト」によって維持されている、国際的に認められた一連のデジタル テレビ オープン標準です。DVB方式の伝送方式は以下のとおりです。

· 衛星テレビ (DVB-S および DVB-S2)

・ケーブルテレビ(DVB-C)

・ワイヤレステレビ(DVB-T)

・ハンドヘルド地上波ワイヤレス(DVB-H)

これらの規格は、伝送システムの物理層とデータリンク層を定義します。デバイスは、同期パラレル インターフェイス (SPI)、同期シリアル インターフェイス (SSI)、または非同期シリアル インターフェイス (ASI) を介して物理層と通信します。データは MPEG-2 トランスポート ストリームとして転送され、より厳しい制限 (DVB-MPEG) に準拠する必要があります。携帯端末へのデータのリアルタイム圧縮伝送のための規格 (DVB-H) が現在テストされています。

これらの伝送方式の主な違いは、使用される変調方式です。アプリケーションごとに周波数帯域幅の要件が異なるためです。高周波搬送波を使用する DVB-S は QPSK 変調を使用し、低周波搬送波を使用する DVB-C は QAM-64 変調を使用し、VHF および UHF 搬送波を使用する DVB-T は COFDM 変調を使用します。

DVB では、オーディオとビデオの送信に加えて、リターン チャネル (DVB-RC) を備えたデータ通信規格 (DVB-DATA) も定義されています。

DVB コーデック、ビデオ: MPEG-2、MPEG-4 AVC、オーディオ: MP3、AC-3、AAC、HE-AAC。

MPEG-1

MPEG-1 は ISO/IEC11172 として正式にリリースされました。

以前の MPEG-1 ビデオ エンコードは品質が比較的低く、主に CD-ROM にビデオを保存するために使用されています。中国で最もよく知られているのは VCD (ビデオ CD) で、そのビデオ エンコードには MPEG-1 が使用されます。CD ディスク メディア用にカスタマイズされたビデオおよびオーディオの圧縮形式です。70 分間の CD 転送速度は約 1.4Mbps です。ただし、MPEG-1 はブロックベースの動き補償、離散コサイン変換 (DCT)、量子化などの技術を採用し、1.2Mbps の伝送速度を最適化します。MPEG-1 はその後、ビデオ CD にコア技術として採用されました。MPEG-1 の出力品質は従来のビデオ レコーダー VTR とほぼ同じであり、信号品質も同等であるため、ビデオ CD が先進国で成功しない理由と考えられます。

MPEG-1 オーディオは、MPEG-1 Layer I、II、III の 3 つの層に分割されており、3 番目の層プロトコルは MP3 と呼ばれる MPEG-1 Layer 3 です。MP3 は、広く普及しているオーディオ圧縮技術です。

MPEG-1 には次の部分があります。

最初の部分 (パート 1): システム、
2 番目の部分 (パート 2): ビデオ、
3 番目の部分 (パート 3): オーディオ、レベル 1、レベル 2、レベル 3 を定義し、MPEG-2 の拡張子を定義します。
第 4 部 (パート 4): 1 回限りのテスト、
第 5 部 (パート 5): リファレンス ソフトウェア、
MPEG-1 の欠点:

1 オーディオ圧縮システムは 2 チャンネル (ステレオ) に限定されます
。 インターレース ビデオに対する標準化されたサポートはなく、圧縮率が低くなります。
標準化された「プロファイル」 (制約付きパラメータ ビットストリーム) は 1 つだけであり、高解像度ビデオには適していません。MPEG-1 は 4k ビデオをサポートできますが、より高解像度のビデオ エンコードを提供し、ハードウェア サポート機能を特定することは困難です。
サポートされる色空間は 4:2:0 の 1 つだけです。
MPEG-2

MPEG-2 コンテンツの紹介

ISO/IEC 13818 として正式にリリースされた MPEG-2 は、衛星 TV、ケーブル TV などの放送信号にビデオとオーディオのエンコードを提供するために一般的に使用されています。MPEG-2 は、わずかな修正を経て、DVD 製品の中核テクノロジーにもなりました。

MPEG-2 は次のように 11 の部分から構成されます。

パート 1: システム - ビデオとオーディオの同期と多重化について説明します。

正式名称は ISO/IEC 13818-1 または ITU-T の H.222.0 です。

MPEG-2 のシステム記述部 (パート 1) では、主に放送やテレビの分野で使用される、信頼性の低いメディア上でデジタル映像信号や音声信号を伝送するための一連の仕組みとしてトランスポート ストリームが定義されています。

MPEG トランスポート ストリームと MPEG プログラム ストリームという 2 つの異なるが関連するコンテナ フォーマットが定義されています。図では TS と PS です。MPEG トランスポート ストリーム (TS) は、非可逆デジタル ビデオとオーディオを伝送するために使用されます。メディア ストリームの始まりと終わりは、放送やテープと同様にマークされない場合があります。例には、ATSC、DVB、SBTVD、HDV などがあります。MPEG-2 システムは、ハード ドライブ、光ディスク、フラッシュ メモリなどのファイルベース メディアのコンテナ フォーマットを設計する MPEG プログラム ストリーム (PS) も定義します。

MPEG-2 PS (プログラム ストリーム) は、ビデオ情報を記憶メディアに保存するために開発されました。MPEG-2 TS (トランスポート ストリーム) は、ネットワーク上でビデオ情報を送信するために開発されました。現在、最も広く使用されている MPEG-2 TS は DVB システムです。TS ストリームと PS ストリームの違いは、TS ストリームのパケット構造が固定であるのに対し、PS ストリームのパケット構造は可変長であることです。PSパケットとTSパケットの構造の違いにより、伝送エラーに対する耐性が異なるため、使用環境も異なります。TSコードストリームは固定長のパケット構造を採用しているため、伝送エラーによりあるTSパケットの同期情報が破壊された場合でも、受信機はその後ろのパケットに含まれる同期情報を固定位置で検出することで同期を回復し、情報の回避を行うことができます。損失、損失。PS パケットの長さは変化するため、ある PS パケットの同期情報が失われると、受信機は次のパケットの同期位置を判断できなくなり、同期が外れて重大な情報損失が発生します。したがって、チャネル環境が比較的悪く、伝送エラーが高い場合には、一般にTSコードストリームが使用され、チャネル環境が良好で、伝送エラーが低い場合には、TSコードストリームが使用されるため、一般にPSコードストリームが使用される。は伝送耐性が強いため、現在伝送メディアで伝送されているMPEG-2ビットストリームは基本的にTSビットストリームのパケットフォーマットを使用しています。

パート 2 (パート 2): ビデオ間の圧縮

正式名称は ISO/IEC 13818-2 または ITU-T H.262 です。

インターレースおよびノンインターレースのビデオ信号を提供する圧縮コーデック。

MPEG-2 の 2 番目の部分であるビデオ部分は MPEG-1 に似ていますが、インターレース ビデオ表示モードのサポートを提供します (インターレース スキャンはテレビ放送で広く使用されています)。MPEG-2 ビデオは低ビット レート (1Mbps 未満) には最適化されていませんが、3Mbit/s 以上のビット レートでは MPEG-2 の方が MPEG-1 よりも大幅に優れています。MPEG-2 には下位互換性があります。つまり、この規格に準拠するすべての MPEG-2 デコーダは、MPEG-1 ビデオ ストリームも通常どおり再生できます。

MPEG-2 テクノロジーは HDTV 伝送システムにも適用されます。MPEG-2 は DVD ビデオで使用されているだけでなく、現在ではほとんどの HDTV (高解像度テレビ) も解像度 1920x1080 の MPEG-2 エンコーディングを使用しています。MPEG-2 の人気により、当初 HDTV 用に用意されていた MPEG-3 は最終的に放棄されました。

MPEG-2 ビデオには通常、複数の GOP (GroupOf Pictures) が含まれており、各 GOP には複数のフレーム (フレーム) が含まれています。フレームのフレーム タイプには、通常、I フレーム (I-frame)、P フレーム (P-frame)、B フレーム (B-frame) があります。このうち、Iフレームはフレーム内符号化を採用し、Pフレームは前方推定を採用し、Bフレームは双方向推定を採用する。一般に、入力ビデオ形式は 25 (CCIR 標準) または 29.97 (FCC) フレーム/秒です。

MPEG-2 は、インターレース スキャンとプログレッシブ スキャンの両方をサポートします。プログレッシブ スキャン モードでは、エンコードの基本単位はフレームです。インターレース走査モードでは、基本コードはフレームまたはフィールドになります。

元の入力画像は、まず YCbCr 色空間に変換されます。ここで、Y は輝度、Cb と Cr は 2 つのクロミナンス チャネルです。Cb は青の色合いを指し、Cr は赤の色合いを指します。各チャネルでは、最初にブロック分割が使用され、次に、符号化の基本単位を構成する「マクロブロック」が形成されます。各マクロブロックは 8x8 サブブロックに再分割されます。タイルに分割されるクロマ チャネルの数は、初期パラメータ設定によって異なります。たとえば、一般的に使用される 4:2:0 フォーマットでは、各クロマ マクロブロックは 1 つの小ブロックのみをサンプリングするため、3 つのチャネル マクロブロックに分割できる小ブロックの数は 4+1+1=6 になります。

I フレームの場合、画像全体が直接エンコード プロセスに入ります。P フレームと B フレームの場合、動き補償が最初に行われます。一般的に言えば、隣接するフレーム間には強い相関があるため、マクロブロックは前のフレームと次のフレームの対応する類似した位置にある類似した領域を見つけたほうがよく、このオフセットは動きベクトルとして記録されます。動き推定は、エンコードのためにエンコーダに送信されます。

8×8 の小さなブロックごとに、離散コサイン変換によって画像が空間領域から周波数領域に変換されます。結果として得られる変換係数は量子化され、長いゼロの可能性を高めるために再配置されます。次に、ランレングス コード (ランレングス コード) を実行します。最後に、ハフマン符号化(Huffman Encoding)を行います。

I フレームのエンコーディングは空間領域の冗長性を削減するためのものであり、P フレームおよび B フレームは時間領域の冗長性を削減するためのものです。

GOP は、一定のパターンで連続する I フレーム、P フレーム、B フレームで構成されます。一般的に使用される構造は 15 フレームで構成され、IBBPBBPBBPBBPBB という形式になります。GOP 内の各フレームの比率の選択は、帯域幅および画質の要件と一定の関係があります。たとえば、B フレームの圧縮時間は I フレームの 3 倍になる可能性があるため、コンピューティング能力が弱い一部のリアルタイム システムでは、B フレームの割合を減らす必要がある場合があります。

MPEG-2 出力ビット ストリームは、一定速度または可変速度にすることができます。DVD アプリケーションなどの最大ビット レートは、最大 10.4 Mbit/s です。固定ビット レートを使用する場合は、均一なビット ストリームを生成するために量子化スケールを常に調整する必要があります。ただし、量子化スケールを大きくすると、目に見える歪みの影響が生じる可能性があります。モザイク現象など。

パート 3 (パート 3): オーディオ - オーディオ圧縮

MPEG-2 のパート III はオーディオ圧縮規格を定義しています。MPEG-2 BC (下位互換性)、MPEG-1 オーディオとの下位互換性。この部分は MPEG-1 のオーディオ圧縮を改善し、2 チャネル以上 (最大 5.1 マルチチャネル) のオーディオをサポートします。MPEG-2 オーディオ圧縮セクションは、下位互換性機能 (MPEG-2 BC とも呼ばれる) も維持しており、MPEG-1 オーディオ コーデックが 2 つの主要なステレオ コンポーネントをデコードできるようにします。また、オーディオ MPEG-1 レイヤ I、II、III の追加ビット レートとサンプリング周波数も定義します。

たとえば、mp2 は MPEG-1 オーディオ レベル 2 であり、規格には ISO/IEC 11172-3、ISO/IEC 13818-3 が含まれます。MPEG-1Layer II は、MPEG-1 の 3 番目の部分である ISO/IEC 11172-3 で定義され、MPEG-2 の 3 番目の部分である ISO/IEC 13818-3 で定義されています。

パート 4 (パート 4): テスト仕様

テスト手順を説明します。

第 5 部 (第 5 部): シミュレーション ソフトウェア

ソフトウェアシミュレーションシステムについて説明します。

パート 6 (パート 6): DSM-CC (デジタル ストレージ メディア コマンド アンド コントロール) 拡張

DSM-CC (Digital Storage Media Command and Control) 拡張機能について説明します。

パート 7 (パート 7): 高度なオーディオ コーディング (AAC)

MPEG-2 のパート VII は、下位互換性のないオーディオ圧縮を定義しています (MPEG-2 NBC とも呼ばれます)。また、MPEG-2 NBC (下位互換性のない MPEG-1Audio) になりました。このセクションでは、拡張されたオーディオ機能について説明します。通常、MPEG-2 AAC と呼ばれるものはこの部分を指します。AAC はアドバンスト オーディオ コーディングの略です。AAC は以前の MPEG オーディオ標準よりも効率的であり、複雑なハイブリッド フィルター バンクを持たない以前の MPEG-1 Layer 3 (MP3) よりもある程度複雑ではありません。1 ~ 48 チャンネル、8 ~ 96 kHz のサンプリング レート、マルチチャンネル、マルチ言語、およびマルチプログラム (マルチプログラム) 機能をサポートします。AAC は、MPEG-4 標準のパート 3 でも説明されています。

第 8 部 (パート 8):

キャンセル。

パート 9 (パート 9): リアルタイム インターフェイスの拡張

リアルタイムインターフェースの拡張。

パート 10 (パート 10): DSM-CC 準拠の拡張

DSM-CC 準拠拡張。

パート 11 (パート 11): 知財

知的財産管理 (IPMP)。XML は ISO/IEC23001-3 で定義されています。MPEG-2 の中核技術には約 640 件の特許が含まれており、これらの特許は主に 20 社と 1 つの大学に集中しています。

MPEG-2オーディオ

MPEG-2 は、新しいオーディオ符号化方式を提供します。セクション 3 と 7 で紹介されます。

第三部

MPEG-2 BC (MPEG-1 オーディオ形式との下位互換性)、サンプリング レートの半分を使用して低ビット レート オーディオを処理 (MPEG-1 Layer 1/2/3 LSF)、最大 5.1 チャネルのマ​​ルチチャネル エンコーディング。

パート VII

MPEG-2 NBC (非後方互換性)。MPEG-2AAC と非後方互換性を提供し、最大 48 チャネルのマ​​ルチチャネル エンコーディングを提供します。

MPEG-2 プロファイルとレベル

MPEG-2 は幅広いアプリケーションを提供しますが、ほとんどのアプリケーションでは標準全体 (通常はサブセットのみ) をサポートするのは非現実的であり、コストが高すぎるため、標準ではこれらのサブセットを表すプロファイルとレベルが定義されています。プロファイルは、圧縮アルゴリズム、クロマ形式などの関連する機能を定義します。レベルは、最大ビット レート、最大フレーム サイズなどのパフォーマンス関連を定義します。アプリケーションは、プロファイルとレベルを通じてその機能を表現する必要があります。プロファイルとレベルの組み合わせは、特定のアプリケーション用の MPEG-2 ビデオ コーディング標準のサブセットを構成します。特定の入力フォーマットの画像の場合、特定の圧縮コーディング ツール セットを使用して、指定されたレート範囲内のコード化ストリームが生成されます。たとえば、DVD プレーヤーは、最もメジャーなプロファイルとメジャー レベル (MP@ML と表記されることが多い) をサポートしていると言えます。

MPEG-2 メイン プロファイル:

名前

英文

中国語

画像エンコーディングの種類

クロマフォーマット YCbCr

アスペクト比

ストレッチモード

SP

シンプルなプロフィール

単純なクラス

Iフレーム、Pフレーム

4:2:0

4:3 または 16:9

MP

主なプロフィール

メインクラス

Iフレーム、Pフレーム、Bフレーム

4:2:0

4:3 または 16:9

SNR

SNR スケーラブルなプロファイル

SNR 階層クラス

Iフレーム、Pフレーム、Bフレーム

4:2:0

4:3 または 16:9

SNR スケーラブル

空間的な

空間的に拡張可能なプロファイル

空間的に階層化可能なクラス

Iフレーム、Pフレーム、Bフレーム

4:2:0

4:3 または 16:9

SNR または空間スケーラビリティ

442P

4:2:2 プロファイル

Iフレーム、Pフレーム、Bフレーム

4:2:2

HP

人目を引く

高級

Iフレーム、Pフレーム、Bフレーム

4:2:0 または 4:2:2

4:3 または 16:9

SNR または空間スケーラビリティ

MPEG-2 のメイン レベル:

名前

英文

フレームレート

最大長さ×最大幅

1 秒あたりの最大輝度サンプル (およそ高さ x 幅 x フレーム周波数)

最大ビットレート (Mbit/s)

LL

低レベル

23.976、24、25、29.97、30

352×288

3,041,280

4

ML

メインレベル

23.976、24、25、29.97、30

720×576

10,368,000 (例外あり): HP の 4:2:0 の場合は 14,475,600、4:2:2 の場合は 11,059,200

15

H-14

1440後半レベル

23.976、24、25、29.97、30、50、59.94、60

1440×1152

47,001,600、ただし例外: HP の 4:2:0 の場合は 62,668,800

60

HL

上級

23.976、24、25、29.97、30、50、59.94、60

1920×1152

62,668,800、ただし例外: HP の 4:2:0 の場合は 83,558,400

80

組み合わせ例

プロフィール@レベル

解像度 (ピクセル)

最大フレームレート (Hz)

サンプリング

ビットレート (Mbit/秒)

応用例

SP@LL

176×144

15

4:2:0

0.096

ワイヤレスハンドセット

SP@ML

352×288

15

4:2:0

0.384

PDA

320×240

24

MP@LL

352×288

30

4:2:0

4

セットトップボックス(STB)

MP@ML

720×480

30

4:2:0

15 (DVD: 9.8)

DVD、SD-DVB

720×576

25

MP@H-14

1440×1080

30

4:2:0

60(HDV:25)

HDV

1280×720

30

MP@HL

1920×1080

30

4:2:0

80

ATSC 1080i、720p60、HD-DVB (HDTV)。

(地上波伝送のビットレートは19.39Mbit/sに制限されます)

1280×720

60

422P@LL

4:2:2

422P@ML

720×480

30

4:2:2

50

I フレームのみを使用する Sony IMX、ブロードキャスト「コントリビューション」ビデオ (I&P のみ)

720×576

25

422P@H-14

1440×1080

30

4:2:2

80

ソニーとパナソニックの将来の MPEG-2 ベースの HD 製品の可能性

1280×720

60

422P@HL

1920×1080

30

4:2:2

300

Potential future MPEG-2-based HD products from Panasonic

1280 × 720

60

MPEG- 2在DVD上的应用

DVD中采用了 MPEG-2标准并引入如下技术参数限制:

  • 分辨率
    o 720 x 480, 704 x 480, 352 x 480, 352 x 240 像素(NTSC制式)
    o 720 x 576, 704 x 576, 352 x 576, 352 x 288 像素(PAL制式)
  • 纵横比
    o 4:3
    o 16:9
  • 帧率(帧播放速度)
    o 59.94 场/秒,23.976帧/秒,29.97帧/秒(NTSC)
    o 50 场/秒,25帧/秒(PAL)
  • 视频+音频 比特率
    o 平均最大缓冲区 9.8 Mbit/s
    o 峰值 15 Mbit/s
    o 最小值 300 Kbit/s
  • YUV 4:2:0
  • 字幕支持
  • 内嵌字幕支持(NTSC only)
  • オーディオ
    o LPCM エンコード: 48kHz または 96kHz、16 または 24 ビット、最大 6 チャネル
    o MPEG Layer 2 (MP2): 48 kHz、最大 5.1 チャネル
    o ドルビーデジタル (DD、AC-3 とも呼ばれます): 48 kHz 、32 ~ 448kbit/s、最大 5.1 チャンネル
    o デジタル ホーム シアター システム - デジタル シアター システム (DTS): 754 kbit/s または 1510 kbit/s
    o NTSC DVD には少なくとも 1 つの LPCM または Dolby Digital が含まれている必要があります
    o PAL 形式の DVD が必要です少なくとも 1 つの MPEG Layer 2、LPCM、または Dolby Digital を含む
  • GOP 構造
    o GOP にはシリアル ヘッダー情報を提供する必要があります
    o GOP に含めることができる最大フレーム数: 18 (NTSC) / 15 (PAL)

DVB への MPEG-2 の適用

DVB-MPEG 関連の技術パラメータ:

  • 次の解像度のいずれかに準拠する必要があります:
    o 720 × 480 ピクセル (24/1.001、24、30/1.001 または 30 フレーム/秒)
    o 640 × 480 ピクセル (24/1.001、24、30/1.001 または 30 フレーム/秒
    ) 544 × 480 ピクセル、24/1.001、24、30/1.001 または 30 フレーム/秒
    o 480 × 480 ピクセル、24/1.001、24、30/1.001 または 30 フレーム/秒
    o 352 × 480 ピクセル、24/1.001、24 、30/1.001 または 30 フレーム/秒
    o 352 × 240 ピクセル、24/1.001、24、30/1.001 または 30 フレーム/秒
    o 720 × 576 ピクセル(25 フレーム/秒)
    o 544 × 576 ピクセル(25 フレーム/秒)
    o 480 × 576 ピクセル、25 フレーム/秒
    o 352 × 576 ピクセル、25 フレーム/秒
    o 352 × 288 ピクセル、25 フレーム/秒

MPEG-2 および NTSC

次の解像度のいずれかに準拠する必要があります:
o 1920 × 1080 ピクセル、最大 60 フレーム/秒 (1080i)
o 1280 × 720 ピクセル、最大 60 フレーム/秒 (720p)
o 最大 720 × 576 ピクセル25 フレーム/秒 (576i、576p) で 50 フレーム/秒 (576i、576p)
o 720 × 480 ピクセル、最大 60 フレーム/秒、30 フレーム/秒 (480i、480p)
o 640 × 480 ピクセル、最大 60 フレーム/秒
注: 1080i は 1920×1088 ピクセルとしてコーディングされますが、表示時に最後の 8 ラインが破棄されます。

YCbCrに関する補足情報

YCbCr は絶対色空間ではなく、YUV の圧縮およびオフセット バージョンです。右の写真はUVカラーバージョンです。

Y (ルマ、ルミナンス) ビデオ。グレースケール値です。UVは彩度のC(ChrominanceまたはChroma)とみなします。主なサンプリング (サブサンプル) フォーマットは、YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1、YCbCr 4:4:4 です。YUV の表現は A:B:C 表現と呼ばれます。

  • 4:4:4 はフルサンプリングを意味します。
  • 4:2:2 は、垂直ダウンサンプリングなしの 2:1 水平サンプリングを意味します。
  • 4:2:0 は、2:1 水平サンプリング、2:1 垂直ダウンサンプリングを意味します。
  • 4:1:1 は、垂直ダウンサンプリングなしの 4:1 水平サンプリングを意味します。

最も一般的に使用される Y:UV 記録比は、通常 1:1 または 2:1 です。DVD ビデオは、一般に I420 と呼ばれる YUV 4:2:0 で記録されます。YUV4:2:0 は、それだけを意味するわけではありません。 U (つまり Cb)、V (つまり Cr) は 0 でなければなりませんが、U:V が相互に参照し、場合によっては非表示になることを意味します。つまり、各行には U または V が 1 つだけ存在します。コンポーネント、行が 4:2:0 の場合、次の行は 4:0:2、次の行は 4:2:0...というように続きます。

上記はwikiのデータを元にまとめたものです。

コーデック学習メモ(4):Mpegシリーズ~Mpeg 4
前回のMPEG-2の学習で疑問がありました、2チャンネルは左右ステレオという理解ですが、5.1チャンネルとは何でしょうか?ドルビー5.1チャンネルはよく見かけます。「0.1」チャネルとは正確には何を指しますか? 今日Wikiに行って調べてみたのですが、関連する内容も学習ノートにまとめられていました。この文書の出典:

ウィキ
http://baike.baidu.com/view/190268.htm
http://baike.baidu.com/view/25047.htm
5.1 チャンネル

ドルビー デジタルでは、5.1 チャンネル設定が最も一般的に使用されますが、ドルビー デジタルではさまざまなチャンネル オプションが可能です。利用可能なすべてのチャネルを以下に示します。

モノラル (中央)
バイノーラル (L、R)、オプションのクロス適用ドルビー サラウンド付き トリア
フォン (L、C、R)
バイノーラル プラス モノラル (L、R、バック)
3 チャンネル ステレオ プラス シングル サラウンド (左、中央、右、サラウンド) )
4 チャンネル サラウンド ステレオ (左前、右前、左後、右後)
5 チャンネル サラウンド ステレオ (左前、中央、右前、左後、右後)
  上記の設定はすべて、オプションで低周波効果を使用し、 Dolby Digital EXマトリックスエンコーディングでリアサラウンドチャンネルを追加します。ドルビー エンコーディング テクノロジーには下位互換性があり、多くのドルビー プレーヤー/デコーダーには、利用可能なスピーカーにさまざまなチャンネルを配信するダウンミックス機能が装備されています。これには、フロント スピーカー (該当する場合) を通じて再生されるサウンド データや、センター スピーカーが該当しない場合の左右のスピーカーへのセンター チャンネルの分配などの機能が含まれます。または、ユーザーが 2.0 スピーカーしか持っていない場合、ドルビー デコーダはマルチチャンネル信号をミックスして 2.0 ステレオにエンコードできます。

5.1、7.1、またはその他のテキストでは、「.1」は低周波 LFE チャネルを指します。

実は5.1チャンネルというのは、5つのスピーカーと1つのサブウーファーを使って臨場感あふれる音楽再生方式を実現するもので、ドルビー社が開発したものなので「ドルビー5.1チャンネル」と呼ばれています。5.1チャンネルシステムでは、左(L)、中©、右®、左後方(LS)、右後方(RS)の5方向に音が出るので、まるでコンサートにいるかのような臨場感を味わえます。ホール。5 つのチャンネルは互いに独立しており、このうち「.1」チャンネルは特別に設計されたサブウーファー チャンネルです。前後左右にスピーカーがあるからこそ、音楽に包まれる臨場感を演出します。右に示すように。

MPEG-4

概要

MPEG-4是一套用于音频、视频信息的压缩编码标准, 由国际标准化组织(ISO)和国际电工委员会(IEC)下属的“動態影像专家组”(Moving Picture Experts Group,即MPEG) 制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網上流媒体、光碟、語音傳送(視訊電話),以及電視廣播。MPEG-4作为ISO/IEC14496正式发布。ISO/IEC 14496-Coding of audio-visual object (AV对象编码)。

为了应对网络传输等环境,传统的 MPEG-1/2 已经不能适应,所以促使了 MPEG-4 的诞生。 与 MPEG-1和MPEG-2相比,MPEG-4的特点是其更适于交互AV服务以及远程监控。MPEG-4是第一个使你由被动变为主动(不再只是观看,允许 你加入其中,即有交互性)的动态图像标准,它的另一个特点是其综合性。从根源上说,MPEG-4试图将自然物体与人造物体相溶合 (视觉效果意义上的)。MPEG-4的设计目标还有更广的适应性和更灵活的可扩展性。 MPEG-4 采用了一系列新技术,来满足在低带宽下传输较高视频质量的需求。DivX,XviD,MS MPEG4 都是采用的MPEG-4 视频编码,除了在 DVDRip 上面的应用,3GPP现在也接纳了 MPEG-4 作为视频编码方案。

最初MPEG-4的主要目的是用于低比特率下的视频通信,但是作为一个多媒体的编码标准,它的范围最后得到了扩展。在技术方面MPEG-4允许不同的软件/硬件开发商创建多媒体对象来提供更好的适应性、灵活性,为数字电视,动态图像,互联网等业务提供更好的质量。

MPEG-4提供范围从每秒几k比特到每秒数十兆比特的,它具有下面功能:

改善MPEG-2的编码效率
MPEG-4基于更高的编码效率。同已有的或即将形成的其它标准相比,在相同的比特率下,它基于更高的视觉听觉质量,这就 使得在低带宽的信道上传送视频、音频成为可能。同时MPEG-4还能对同时发生的数据流进行编码。一个场景的多视角或多声道数据流可以高效、同步地合成为 最终数据流。这可用于虚拟三维游戏、三维电影、飞行仿真练习等。
提供混合媒体数据(视频,音频,语音)的编码能力
差错容忍使得内容稳定传输。
当在传输有误码或丢包现象时,MPEG4受到的影响很小,并且能迅速恢复。
提供受众视听场景的互动能力,MPEG-4终端用户提供不同的对象支持各种互动要求。
MPEG-4提供了基于内容的多媒体数据访问工具,如索引、超级链接、上传、下载、删除等。利用这些工具,用户可以方便地 从多媒体数据库中有选择地获取自己所需的与对象有关的内容,并提供了内容的操作和位流编辑功能,可应用于交互式家庭购物,淡入淡出的数字化效果等。 MPEG-4提供了高效的自然或合成的多媒体数据编码方法。它可以把自然场景或对象组合起来成为合成的多媒体数据。
MPEG-4对传输数据网是透明的,它可以兼容各种网络。
MPEG-4提供了易出错环境的鲁棒性,来保证其在许多无线和有线网络以及存储介质中的应用,此外,MPEG-4还支持基于内容的的可分级性,即把内容、质量、复杂性分成许多小块来满足不同用户的不同需求,支持具有不同带宽,不同存储容量的传输信道和接收端。
这些特点无疑会加速多媒体应用的发展,从中受益的应用领域有:因特网多媒体应用;广播电视;交互式视频游戏;实时可视通 信;交互式存储媒体应用;演播室技术及电视后期制作;采用面部动画技术的虚拟会议;多媒体邮件;移动通信条件下的多媒体应用;远程视频监控;通过ATM网 络等进行的远程数据库业务等。
MPEG-4视频编码核心思想

在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代压缩编码技术,着 眼于图像信号的统计特性来设计编码器,属于波形编码的范畴。第一代压缩编码方案把视频序列按时间先后分为一系列帧,每一帧图像又分成宏块以进行运动补偿和编码,这种编码方案存在以下缺陷:

将图像固定地分成相同大小的块,在高压缩比的情况下会出现严重的块效应,即马赛克效应;
不能对图像内容进行访问、编辑和回放等操作;
未充分利用人类视觉系统(HVS,Human Visual System)的特性。
  MPEG-4则代表了基于模型/对象的第二代压缩编码技术,它充分利用了人眼视觉特性,抓住了图像信息传输的本质,从轮廓、纹理思路出发,支持基于视觉内容的交互功能,这适应了多媒体信息的应用由播放型转向基于内容的访问、检索及操作的发展趋势。

AV对象(AVO,AudioVisual Object)是MPEG-4为支持基于内容编码而提出的重要概念。对象是指在一个场景中能够访问和操纵的实体,对象的划分可根据其独特的纹理、运动、形状、模型和高层语义为依据。在MPEG-4中所见的视音频已不再是过去MPEG-1、MPEG-2中图像帧的概念,而是一个个视听场景(AV场景),这些 不同的AV场景由不同的AV对象组成。AV对象是听觉、视觉、或者视听内容的表示单元,其基本单位是原始AV对象,它可以是自然的或合成的声音、图像。原 始AV对象具有高效编码、高效存储与传输以及可交互操作的特性,它又可进一步组成复合AV对象。因此MPEG-4标准的基本内容就是对AV对象进行高效编 码、组织、存储与传输。AV对象的提出,使多媒体通信具有高度交互及高效编码的能力,AV对象编码就是MPEG-4的核心编码技术。

MPEG-4实现基于内容交互的首要任务就是把视频/图像分割成不同对象或者把运动对象从背景中分离出来,然后针对不同对象采用相应编码方法,以实现高效压缩。因此视频对象提取即视频对象分割,是MPEG-4视频编码的关键技术,也是新一代视频编码的研究热点和难点。

MPEG-4不仅可提供高压缩率,同时也可实现更好的多媒体内容互动性及全方位的存取性,它采用开放的编码系统,可随时加入新的编码算法模块,同时也可根据不同应用需求现场配置解码器,以支持多种多媒体应用。

MPEG-4各部分

MPEG-4由一系列的子标准组成,被称为部,包括以下的部分。对于媒体编解码,重点关注Part2,Part 3, Part 10。

第一部(ISO/IEC 14496-1):系统

描述视訊和音訊的同步以及混合方式(Multiplexing,简写为MUX)。定义了 MP4 容器格式, 支持类似 DVD 菜单这样的直观和互动特性等。

第二部(ISO/IEC 14496-2):视频

さまざまな視覚情報 (ビデオ、静止テクスチャ、コンピューター生成グラフィックスなど) のコーデックを定義します。ビデオ部分の場合、最も一般的に使用される「プロファイル」の 1 つは Advanced Simple Profile (ASP) です。たとえば、XviD エンコーディングは MPEG-4Part 2 に属します。3ivx、DivX4/Project Mayo、DivX 5、Envivio、ffmpeg/ffds、mpegable、Nero Digital、QuickTime、Sorenson、XviD、およびその他の一般的なビデオ形式を含む、Divx 3.11、MS MPEG-4、RV9/10、 VP6 、WMV9 は標準 MPEG-4 標準の一部ではありません。

パート 3 (ISO/IEC 14496-3): オーディオ

さまざまなオーディオ信号をエンコードするためのコーデックのコレクションを定義します。Advanced Audiocoding (AAC) およびその他のオーディオ/音声コーディング ツールのいくつかのバリエーションが含まれています。つまり、LCAAC、HE AAC などの AAC オーディオ規格は 5.1 チャネルのエンコードをサポートしており、(MP3、OGG などと比較して) 低いビット レートでより良い結果を達成できます。

パート 4 (ISO/IEC 14496-4): 適合性

この規格の他の部分への適合性テストの手順を定義します。

パート 5 (ISO/IEC 14496-5): リファレンス ソフトウェア

ソフトウェアは、機能を実証し、この規格の他の部分の機能を説明するために提供されています。

パート VI (ISO/IEC 14496-6): マルチメディア伝送統合フレームワーク

即DMIF:配信マルチメディア統合フレームワーク

パート 7 (ISO/IEC 14496-7): 最適化されたリファレンス ソフトウェア

実装の最適化の例を示します (ここでの実装はセクション 5 を参照)。

パート 8 (ISO/IEC 14496-8): IP ネットワーク経由の送信

MPEG-4 コンテンツを IP ネットワーク経由で転送する方法を定義します。

パート 9 (ISO/IEC 14496-9): リファレンス ハードウェア

この規格の他の部分の機能をハードウェアに実装する方法を示すために、ハードウェア設計スキームが提供されています。

パート 10 (ISO/IEC 14496-10): アドバンスト ビデオ コーディング、ITU H.264 とも呼ばれ、H.264/AVC と表記されることも多い

または Advanced Videocoding (Advanced Videocoding、略称 AVC): ビデオ コーデック (コーデック) が定義されています。AVC と XviD は両方とも MPEG-4 エンコーディングに属しますが、AVC は MPEG-4 Part 10 に属するため、より技術的に特徴付けられます。 MPEG-4 Part2 に属する XviD よりも高度です。また、技術的には ITU-T H.264 規格と一致しているため、正式名称は MPEG-4 AVC/H.264 となります。

パート 11 (ISO/IEC 14496-11): シーン記述とアプリケーション エンジン

2D バージョンと 3D バージョンを含む複数のプロファイルで利用可能なインタラクティブ メディア。MPEG-4 Part 1:2001 および Part1 の 2 つの修正を改訂しました。アプリケーション エンジン (ダウンロード可能な Java バイト コード アプリケーションの配信、ライフ サイクル、フォーマット、動作)、バイナリ シーン フォーマット (BIFS: Binary Format for Scene)、拡張可能な MPEG-4 テキスト フォーマット (MPEG-4 の XML テキスト フォーマットを使用した記述) を定義します。 4 マルチメディア コンテンツ) システム レベルの表現。つまり、MPEG-4 Part21 の BIFS、XMT、および MPEG-J です。

パート 12 (ISO/IEC 14496-12): ISO ベースのメディア ファイル形式

メディア コンテンツを保存するためのファイル形式を定義します。

パート 13 (ISO/IEC 14496-13): IP

知的財産の管理と保護のための IPMP の拡張。

パート 14 (ISO/IEC 14496-14): MPEG-4 ファイル形式

Part XII に基づいて MPEG-4 コンテンツを保存するためのビデオ ファイル形式を定義します。

パート 15 (ISO/IEC 14496-15): AVC ファイル形式

第12パートに基づいて第10パートの映像コンテンツを格納するためのファイルフォーマットが定義される。

パート 16 (ISO/IEC 14496-16): アニメーション フレームワークの拡張

アニメーション フレームワーク拡張機能 (AFX:Animation Framework eXtension)。

パート 17 (ISO/IEC 14496-17): 同期テキスト字幕形式

まだ完了していません - 「最終委員会草案」、FCD: 最終委員会草案は 2005 年 1 月に達しました。

パート 18 (ISO/IEC 14496-18): フォントの圧縮とストリーミング (パブリック フォント形式の場合)。

パート 19 (ISO/IEC 14496-19): 合成された TextureStream。

パート 20 (ISO/IEC 14496-20): 単純なシーン表現

ライトウェイト シーン表現の LASeR はまだ完成していませんが、2005 年 1 月に「最終委員会ドラフト」に到達し、FCD は最終委員会ドラフトに到達しました。

パート 21 (ISO/IEC 14496-21): レンダリング用の MPEG-J 拡張機能

まだ完了していません - 「委員会草案」は 2005 年 1 月に達しました、委員会草案の CD)。

プロフィールとレベル

MPEG-4 には、多数のエンコード方式と豊富な設定が用意されています。MPEG-2 と同様、アプリケーションが MPEG-4 のフルセットをサポートすることは一般に不可能であり、サブセットはプロファイルとレベルによって記述されます。これらのサブセットは、「プロファイル」を通じてデコーダの要件を示します。計算の複雑さを避けるために、各プロファイルには 1 つ以上の「レベル」があります。プロファイルとレベルの効果的な組み合わせにより、コード ジェネレーターは、他の MPEG-4 機器との相互通信を維持しながら、標準で必要なサブセットを実装するだけで済みます。(通常、デコードのサポート範囲はエンコードのサポート範囲よりも大きいです)、他の MPEG-4 デバイスが規格に準拠しているかどうかを確認します (準拠テスト)。

H.264/AVC (つまり、MPEG-4 Part 4) の場合、次のプロファイルが提供されます。

特定のプロファイルでの機能のサポート

特徴

CBP

血圧

XP

MP

ハイピー

Hi10P

Hi422P

Hi444PP

Bスライス

いいえ

いいえ

はい

はい

はい

はい

はい

はい

SI スライスと SP スライス

いいえ

いいえ

はい

いいえ

いいえ

いいえ

いいえ

いいえ

柔軟なマクロブロック順序付け (FMO)

いいえ

はい

はい

いいえ

いいえ

いいえ

いいえ

いいえ

任意のスライス順序付け (ASO)

いいえ

はい

はい

いいえ

いいえ

いいえ

いいえ

いいえ

冗長スライス (RS)

いいえ

はい

はい

いいえ

いいえ

いいえ

いいえ

いいえ

データのパーティショニング

いいえ

いいえ

はい

いいえ

いいえ

いいえ

いいえ

いいえ

インターレースコーディング (PicAFF、MBAFF)

いいえ

いいえ

はい

はい

はい

はい

はい

はい

CABACエントロピーコーディング

いいえ

いいえ

いいえ

はい

はい

はい

はい

はい

8×8 と 4×4 の変換適応性

いいえ

いいえ

いいえ

いいえ

はい

はい

はい

はい

量子化スケーリング行列

いいえ

いいえ

いいえ

いいえ

はい

はい

はい

はい

Cb と Cr の個別 QP 制御

いいえ

いいえ

いいえ

いいえ

はい

はい

はい

はい

モノクロ(4:0:0)

いいえ

いいえ

いいえ

いいえ

はい

はい

はい

はい

クロマフォーマット

4:2:0

4:2:0

4:2:0

4:2:0

4:2:0

4:2:0

4:2:0/4:2:2

4:2:0/4:2:2/4:4:4

サンプルの深さ (ビット)

8

8

8

8

8

8~10

8~10

8~14

個別のカラープレーンコーディング

いいえ

いいえ

いいえ

いいえ

いいえ

いいえ

いいえ

はい

予測可逆コーディング

いいえ

いいえ

いいえ

いいえ

いいえ

いいえ

いいえ

はい

レベルは、最大ピクチャ割り当て、フレーム レート、ビット レートなど、プロファイル デコーダのパフォーマンス要件の範囲を示すために使用されます。デコーダの場合、指定されたレベルでは、このレベル以下のコード ストリームをデコードできる必要があります。(特定のレベルに準拠するデコーダは、そのレベルおよびそれより低いレベルでエンコードされたすべてのビットストリームをデコードできる必要があります。出典: http://en.wikipedia.org/wiki/H.264/MPEG-4_AVC )

最大のプロパティ値を持つレベル

レベル

最大マクロブロック数

最大ビデオ ビット レート (VCL)

高解像度 @
フレーム レート
(最大保存フレーム数)の例

毎秒

フレームごと

BP、XP、MP
(kbit/秒)

HiP
(キロビット/秒)

Hi10P
(キロビット/秒)

Hi422P、Hi444PP
(kbit/s)

1

1,485

99

64

80

192

256

128×[email protected] (8)
176×[email protected] (4)

1b

1,485

99

128

160

384

512

128×[email protected] (8)
176×[email protected] (4)

1.1

3,000

396

192

240

576

768

176×[email protected] (9)
320×[email protected] (3)
352×[email protected] (2)

1.2

6,000

396

384

480

1,152

1,536

320×[email protected] (7)
352×[email protected] (6)

1.3

11,880

396

768

960

2,304

3,072

320×[email protected] (7)
352×[email protected] (6)

2

11,880

396

2,000

2,500

6,000

8,000

320×[email protected] (7)
352×[email protected] (6)

2.1

19,800

792

4,000

5,000

12,000

16,000

352×[email protected] (7)
352×[email protected] (6)

2.2

20,250

1,620

4,000

5,000

12,000

16,000

352×[email protected](10)
352×[email protected] (7)
720×[email protected] (6)
720×[email protected] (5)

3

40,500

1,620

10,000

12,500

30,000

40,000

352×[email protected] (12)
352×[email protected] (10)
720×[email protected] (6)
720×[email protected] (5)

3.1

108,000

3,600

14,000

17,500

42,000

56,000

720×[email protected] (13)
720×[email protected] (11)
1280×[email protected] (5)

3.2

216,000

5,120

20,000

25,000

60,000

80,000

1,280×[email protected] (5)
1,280×1,[email protected] (4)

4

245,760

8,192

20,000

25,000

60,000

80,000

1,280×[email protected] (9)
1,920×1,[email protected] (4)
2,048×1,[email protected] (4)

4.1

245,760

8,192

50,000

62,500

150,000

200,000

1,280×[email protected] (9)
1,920×1,[email protected] (4)
2,048×1,[email protected] (4)

4.2

522,240

8,704

50,000

62,500

150,000

200,000

1,920×1,[email protected] (4)
2,048×1,[email protected] (4)

5

589,824

22,080

135,000

168,750

405,000

540,000

1,920×1,[email protected] (13)
2,048×1,[email protected] (13)
2,048×1,[email protected] (12)
2,560×1,[email protected] (5)
3,680×1,[email protected] (5)

5.1

983,040

36,864

240,000

300,000

720,000

960,000

1,920×1,[email protected] (16)
4,096×2,[email protected] (5)
4,096×2,[email protected] (5)

编解码学习笔记(五):Mpeg系列——AAC音频
 下面资料来自wiki。AAC在MPEG2和MPEG4中定义。

扩展名:.m4a, .m4b, .m4p, .m4v, .m4r, .3gp, .mp4, .aac
互联网媒体类型:audio/aac, audio/aacp, audio/3gpp, audio/3gpp2,audio/mp4, audio/MP4A-LATM, audio/mpeg4-generic
格式:有损数据压缩
延伸自:MPEG-2 音频
标准:ISO/IEC 13818-7(MPEG-2第7部), ISO/IEC 14496-3(MPEG-4第3部)

AAC(Advanced Audio Coding),中文称为“高级音频编码”,出现于1997年,基于 MPEG-2的音频编码技术。由Fraunhofer IIS、杜比实验室、AT&T、Sony(索尼)等公司共同开发,目的是取代MP3格式。2000年,MPEG-4标准出现后,AAC 重新集成了其特性,加入了SBR技术和PS技术,为了区别于传统的 MPEG-2 AAC 又称为 MPEG-4 AAC。

AAC格式的主要扩展名有三种:

AAC - MPEG-2 オーディオ トランスポート ストリーム (ADTS、MPEG-2 を参照) コンテナを使用します。これは、MPEG-4 コンテナを使用する MP4/M4A 形式とは異なり、従来の AAC エンコーディング (FAAC のデフォルト パッケージ) に属します。ただし、FAAC は MPEG-4 カプセル化 AAC も出力できます)
MP4 - MPEG-4 Part 14 (Part 14) の簡易バージョン、つまり 3GPP Media Release 6 Basic (3gp6、3GP を参照) を使用したカプセル化 AAC エンコード (Nero AAC エンコーダは出力のみ可能) MPEG-4 Encapsulated AAC);
M4A - 純粋なオーディオ MP4 ファイルとビデオを含む MP4 ファイルを区別するために Apple (Apple) によって使用される拡張子、Apple iTunes は純粋なオーディオ MP4 ファイルに「.M4A」を使用します。M4A の本質はオーディオ MP4 と同じであるため、オーディオ MP4 ファイルの拡張子を直接 M4A に変更することもできます。
  圧縮率の高い音声圧縮アルゴリズムとして、AAC の圧縮率は通常 18:1 ですが、一部の情報源では 20:1 であり、MP3 よりもはるかに優れているとされています。 -channel と、複雑さの低い記述メソッドの使用により、同じ仕様のほとんどすべての従来のエンコードメソッドよりも優れています。しかし、2006 年までは、この形式で音楽を保存する人は少なく、この形式を再生できる MP3 プレーヤーもさらに少なく、現在では Apple iPod、Sony ウォークマン (NWZ-A、NWZ-S、NWZ) のみです。 -E、NWZ-Xシリーズ)、任天堂NDSi。Meizu M8 のほか、Apple iTunes など、コンピューター上の多くの音楽再生ソフトウェアは AAC をサポートしています (AAC デコーダーがインストールされている場合)。ただし、携帯電話の分野では AAC のサポートは非​​常に一般的であり、Nokia、Sony Ericsson、Motorola などのブランドはいずれも中高級製品で AAC をサポートしています (主に初期の LC-AAC、および携帯電話の性能の発展に伴い、HE-AAC のサポートも広く普及しています)。

AAC は、最大 48 のオーディオ トラック、15 の低周波 (LFE) オーディオ トラック、5.1 マルチチャンネルのサポート、より高いサンプリング レート (オーディオ CD の場合は最大 96 kHz、44.1 kHz)、およびより高いサンプリング精度 (8 ビット、16 ビット、24 ビット、 32 ビット、オーディオ CD は 16 ビット)と多言語互換性、より高いデコード効率、一般的に言えば、AAC は MP3 ファイルより 30% 小さいという前提でより良い音質を提供できます。

従来の LC-AAC と比較して、高効率 AAC (HE-AAC または AAC-HE と表記) は「aacPlus v1」または「AAC+」とも呼ばれ、SBR (スペクトル バンド レプリケーション) と AAC テクノロジーを組み合わせたもので、低ビット レートに適しています ( 64kbps 以下);
HE-AAC v2、「aacPlus v2」としても知られています - HE-AAC にパラメトリック ステレオ (パラメトリック ステレオ、PS) と SBR テクノロジーを組み合わせています。
  「AAC」は大きなファミリーであるため、さまざまなシーンのニーズに合わせて 9 つの仕様に分かれていますが、AAC プロファイルの多様性により、一般のコンピューター ユーザーは非常に悩みます。

MPEG-2 AAC LC 低複雑性仕様 (低複雑性)
MPEG-2 AAC メイン メイン仕様
MPEG-2 AAC SSR スケーラブル サンプル レート仕様 (スケーラブル サンプル レート)
MPEG-4 AAC LC 低複雑性仕様 (低複雑性)、現在 オーディオ部分携帯電話で一般的な MP4 ファイルには、この標準音声ファイルが含まれています。
MPEG-4 AAC メイン メイン仕様
MPEG-4 AAC SSR 可変サンプリング レート仕様 (スケーラブル サンプル レート)
MPEG-4 AAC LTP 長期予測仕様 (Long Term予測)
MPEG-4 AAC LD 低遅延仕様 (Low Delay)
MPEG-4 AAC HE 高効率仕様 (High Efficiency)
  上記仕様のうち、メイン仕様 (Main) はゲインコントロールを除くすべての機能を含み、音質が最も優れています低複雑性仕様 (LC) はゲイン制御がなく比較的シンプルですが、コーディング効率が向上します。「SSR」は「LC」仕様とほぼ同じですが、より多くのゲイン制御機能が付いています。さらに、MPEG -4 AAC/LTP/LD/HE はすべて低ビット レートでのエンコードに使用され、特に「HE」は最近よく使用されるエンコーダーである Nero ACC エンコーダーでサポートされていますが、一般的に言えば、メイン仕様の音質とLC 仕様に大きな違いはなく、現在の携帯電話のメモリ容量が適切なレベルに達していないため、現在最もよく使用されている AAC 仕様のほとんどは「LC」仕様です。

コーデック学習メモ (6): H.26x シリーズ
いくつかの情報源と wiki および http://www.365pr.net/tech_view.asp?id=315。

H.26xにはH.261、H.262、H.263、H.263v2、H.264が含まれており、H.261は基本的には使用されなくなりました。このうち H.262 と H.264 は MPEG シリーズで導入されており、それぞれ MPEG2 の Part 2 と MPEG-4 の Part 10 に相当します。この情報は編集されていません。

H.261

H.261の速度は64kbpsの整数倍(1~30倍)です。これは元々、ISDN (統合サービス デジタル ネットワーク) 上の双方向オーディオビジュアル サービス (特にビデオ電話とビデオ会議) 用に設計されました。

H.261 は最も古い動画圧縮規格であり、CIF および QCIF の画像フォーマットのみを処理します 画像の各フレームは、画像層、マクロブロック グループ (GOB) 層、マクロブロック (MB) 層、ブロック (Block) と各部分に分かれています動き補償を伴うフレーム間予測、DCT (離散コサイン変換)、量子化、エントロピー符号化、固定レート チャネルに適応したレート制御など、ビデオ符号化の詳細が詳細に定式化されます。実際のエンコード アルゴリズムは MPEG アルゴリズムに似ていますが、MPEG アルゴリズムとは互換性がありません。H.261 では、リアルタイム エンコード中に MPEG よりもはるかに少ない CPU 計算が必要となり、帯域幅の使用を最適化するために、このアルゴリズムには画質と動きの範囲の間のバランスを考慮したメカニズムが導入されています。言い換えれば、動きの激しい画像は、比較的静止した画像よりも品質が低くなります。したがって、この方法は、一定のコード ストリームの可変品質符号化に属します。

H.261 は、最初の実用的なデジタル ビデオ コーディング規格です。H.261 の設計は非常に成功しており、その後の国際ビデオ コーディング標準は、MPEG-1、MPEG-2/H.262、H.263、さらには H.261 など、基本的に H.261 と同じ設計フレームワークに基づいています。 .264。同様に、H.261 開発委員会 (大久保栄、日本名は大久保栄が委員長) の基本的な運営方法も、その後のビデオ符号化標準開発組織に引き継がれました。H.261 は、動き補償に基づくフレーム間予測、離散コサイン変換に基づく空間変換コーディング、量子化、ジグザグ スキャン、エントロピー コーディングを含むハイブリッド コーディング フレームワークを使用します。

実際、H.261 標準ではビデオのデコード方法のみが規定されています (後続のビデオ コーディング標準もこの慣行を継承しています)。この場合、実際には、開発者は、エンコーダによって生成されたコード ストリームが H.261 仕様に従って製造されたすべてのデコーダでデコードできる限り、エンコーダの設計においてエンコード アルゴリズムをかなり自由に設計できます。エンコーダーは、独自のニーズに応じて入力ビデオに対して任意の前処理を実行でき、デコーダーも出力ビデオを表示する前に自由に後処理を実行できます。デブロッキング フィルターは効果的な後処理技術であり、ブロック動き補償エンコーディングの使用によって引き起こされるブロックノイズ (モザイク) を大幅に軽減できます。低ビット レートのビデオ (Web サイトのビデオ ニュースなど) を視聴しているときに気づくでしょう。この厄介な効果。そのため、H.264などの後続のビデオ符号化規格では、標準の一部としてデブロッキングフィルタが追加されています(H.264が使用されている場合でも、デコード完了後に規格外のデブロッキングフィルタが追加されます。また、主観的なビデオを改善することもできます)品質)。

その後のビデオ符号化規格は、H.261 をベースに徐々に改良され、新しい機能が導入されていると言えます。H.261 と比較すると、現在のビデオ コーディング規格はさまざまなパフォーマンス面で大幅に向上しているため、一部のビデオ会議システムやネットワーク ビデオにおける下位互換性を除いて、H.261 は時代遅れの規格となっています。 H.261を使用します。しかし、これは H.261 がビデオ コーディングの分野における重要なマイルストーン標準になることを妨げるものではありません。

H.263

H.263 は元々、H.324 ベースのシステム (つまり、公衆交換電話網やその他の回線ベースのネットワークを介したビデオ会議やビデオ電話) での伝送用に設計されました。その後、H.263 は、H.323 (RTP/IP ネットワークに基づくビデオ会議システム)、H.320 (ISDN に基づくビデオ会議システム)、RTSP (ストリーミング メディア伝送システム)、およびSIP (インターネットベースのビデオ会議)。

以前の国際ビデオ コーディング標準 (H.261、MPEG-1、および H.262/MPEG-2) に基づいて、H.263 のパフォーマンスは革命的に向上しました。最初のバージョンは 1995 年に完成し、すべてのビット レートで以前の H.261 よりも優れています。その後、1998 年に新しい機能が追加された H.263+ の 2 番目のバージョン、つまり H.263v2 と、2000 年に完成した H.263++ の 3 番目のバージョン、つまり H.263v3 がありました。

H.263v2 (一般に H.263+ または H.263 1998 とも呼ばれます) は、ITU-TH.263 ビデオ コーディング規格の第 2 版の非公式名です。H.263 のオリジナル バージョンのテクノロジーはすべて維持されていますが、コーディング効率が大幅に向上し、いくつかの付録を追加することで、伝送チャネルでのデータ損失に耐える機能 (堅牢性) の強化など、その他の機能が提供されます。H.263+ プロジェクトは 1997 年末から 1998 年初めに完了しました (「完了」をどのように定義するかによって異なります)。

H.263v3: 「H.263++」と呼ばれる次のプロジェクトがすぐに開始され、H.263+ に基づいてさらに新しい機能が追加されました。H.263++は2000年末に完成しました。次の付録を追加しました。

付録 A - 逆変換精度仕様
付録 B - 仮説参照デコーダ
付録 C - マルチポイントに関する考慮事項
付録 D - 無制限動きベクトル モード
付録 E - 構文ベースの算術符号化モード
付録 F - 高度な予測モード
付録 G - PB フレーム モード
付録 X H - 符号化されたビデオ信号の前方誤り訂正
H.263 の後の、ITU-T (MPEG と協力) の次世代ビデオ コーデックは、H.264、または AVC および MPEG-4 Part 10 です。H.264 はパフォーマンスにおいて H.263 を大幅に上回っているため、一般に H.263 は時代遅れの規格であると考えられています (ただし、その開発はずっと前に完了していませんでした)。新しいビデオ会議製品のほとんどは、以前に H.263 および H.261 をサポートしていたのと同様に、すでに H.264 ビデオ コーデックをサポートしています。

话虽然如此,H.263在3GPP中仍然占有很高的地位,后继修订的版本,包括运营商的标准一直保留着H.263, 作为必选的要求,地位远远高于H.264,这是个奇怪的现象。一个重要的可能原因是H.263的编码比H.264的要轻载,在手机的modem中提供 H.263的编解码能力,不提供H.264的编解码能力,或者只提供H.264的解码能力不提供编码能力,如果不是智能手机不能在主板的其他芯片(例如 CPU)提供H.264的编解码能力,开发者就没什么办法,H.263可以通过软件来提供,H.264对处理能力的要求很高,目前需要依赖硬件能力提供。因此H.263仍然具有很大的市场,尤其对于小尺寸的手持设备,屏幕分辨率有限,高清无意义。

H.264

H.264等同于MPEG-4的第10部,在这里仍然收集资料进行学习记录。

在H.263之后,ITU-T(在与MPEG的合作下)的下一代视 频编解码器是H.264,或者叫AVC以 及MPEG-4第 10部分。由于H.264在性能上超越了H.263很多,现在通常认为H.263是一个过时的标准(虽然它的开发完成并不是很久以前的事情)。大多数新的 视频会议产品都已经支持了H.264视频编解码器,就像以前支持H.263和H.261一样。

H.264/AVC可工作于多种速率,广泛应用于Internet/intranet上的多媒体流服务、视频点播、可视游戏、低码率移动多媒体通信 (视频 手机等)、交互式多媒体应用、实时多媒体监控、数字电视与演播电视和虚拟视频会议等,大有在上述领域一统天下的趋势,有非常广泛的开发和应用前景。

H.264 は、MPEG-4 AVC または MPEG-4 Part10 としても知られる高度なビデオ圧縮技術です。ITU-T は 1998 年から H.26L と H.26S を 2 つのグループに分けています。H.26L はプログラム時間の長い高圧縮符号化技術を開発し、H.26S は短いプログラムの標準策定部門を指します。従来の H.263 は H.26S の標準化技術であり、H.264 規格は H.26L に基づいて開発されました。誤解を招かないように、ITU-T ではこの規格の正式名称として H.264 を使用することを推奨しています。H.264 は、今日の国際的なビデオ コーディングおよびデコーディング テクノロジの最新の成果を体現しています。同じ再構築された画質の下では、H.264 は他のビデオ圧縮コードよりも高い圧縮率と、IP およびワイヤレス ネットワーク チャネルの適応性に優れています。

まず、H.264 は、MPEG-2 の 2 倍、MPEG-4 の 1.5 倍という超高圧縮率を持っています。このような高い圧縮率は、符号化の際の演算量が多いことと引き換えに得られるものであり、H.264における符号化処理の演算量はMPEG-2の10倍以上となります。ただし、そのデコードの計算負荷はそれほど増加していません。CPUの周波数とメモリの急速な発展という観点から見ると、1995年にMPEG-2が登場した当時、主流のCPUはPentium 100であり、メモリはさらに悲惨なものでした。現在、主流の CPU の動作周波数は当時の 30 倍、メモリは 50 倍以上に拡張されています。したがって、H.264 エンコーディングの大規模な計算は、現時点では大きな問題ではありません。

高い圧縮率により画像データ量が削減され、保存や送信に便利です。基本仕様のオープンな国際標準と公正なライセンス制度に加え、テレビ放送、家電、通信の三大産業がそろってH.264の実用化研究開発センターに入っている。米国先進テレビジョンシステム会議と日本無線産業協会はいずれも、地上デジタルテレビ放送の符号化方式としてH.264を使用する準備を進めている。欧州デジタル TV 放送標準化グループも、デジタル TV の符号化方式として H.264 を採用しています。

家電業界のビデオ ストレージ機器のメーカーも H.264 に注目しています。東芝やNECの次世代ブルーレーザーディスクHD DVD-ROMは、ソニーなど大手9社のブルーレイディスクに比べて容量が小さいため、映像の圧縮符号化がH.264に変更され、最終的には番組の録画時間はブルーレイディスクとほぼ同等です。H.264ではHDTV番組録画やSDTV長時間録画も可能。そのため、LSIチップメーカーもH.264を重視しています。D9 DVD ディスクの容量はわずか 8.5GB で、2 時間の HDTV 番組を保存するには不十分ですが、H.264 で圧縮することが可能になります。一方、通信の分野では、インターネット エンジニアリング タスク フォースが、リアルタイム トランスポート プロトコル ストリームの形式として H.264 の標準化を開始しました。インターネットや携帯電話でのビデオ伝送でも、エンコード方式として H.264 が使用されます。

MPEG 圧縮符号化 H.264 との変更点の 1 つは、フレーム内符号化 I ピクチャにフレーム内予測符号化技術が追加され、周囲のデータの差分値を利用してピクチャを再構成できることです。デコード中。動き予測ブロックでは、H.264では総合動き予測とIピクチャの画面内予測が採用されて符号量は削減されるが、LSIの演算処理量は増加する。このため、H.264では、LSIの負担を軽減し、画質を向上させるために、DCTという簡易処理技術が導入されています。H.264 と MPEG-2 および MPEG-4 の違いは、エントロピー コーディング ブロックにも存在し、H.264 のエントロピー コーディング CAVLC (Content Adaptive Variable Length Code) および CABAC (Content Adaptive Binary Algorithm Code) により、誤り訂正を改善できます。能力。MPEG-2 と MPEG-4 はハフマン符号化です。また、ノイズを低減する効果のあるロック解除フィルター(Deblocking Filter)を追加しました。H.264の整数変換は4×4画素ブロックを単位とするため、元の8×8画素ブロックに比べてブロックノイズがさらに低減され、画質がさらに向上します。

H.264标准分为三档:基本档次;主要档次(可用于SDTV、HDTV和DVD等);以及扩展档次(用于网络的视频流)。其中H.264的基本档 次是免费,用户可以无偿使用,现得到美国苹果公司和美国Cisco系统公司、中国联想公司、诺基亚、美国On2技术公司、德国西门子、TI公司等的支持; 其许可体系要比MPEG-4单纯,公正无差别对待用户和专利持有者。H.264替代MPEG-4的呼声很高,除了其高性能外,低额专利费和公正的无差别许 可制度也至关重要。由于技术的日益成熟,半导体厂商已在进行H.264的编码/解码LSI的开发。特别是HDD录像机和DVD录像机等设备中,采用 H.264的实例已很多,更引起了半导体厂商的关心。加之,H.264采用的动画编码方式和音频编码方式具有多样化特性,今后几乎将会是全部厂商的主要规格之一。

编码效率比较

Codec

MPEG-4

H.263

MPEG-2

H.264

39%

49%

64%

MPEG-4

17%

43%

H.263

31%

编解码学习笔记(七):微软Windows Media系列
资料来源于wiki与 http://chaoqunz.blog.163.com/blog/static/6154877720084493941186/。

Microsoft Corporation が主導するオーディオおよびビデオ コーディング シリーズは、主にネットワーク ビデオ伝送用に登場しましたが、現在は HDTV に向けて進み、WMV HD アプリケーションが開発されています。WMV (Windows Media Video) は、Microsoft Corporation によって開発されたデジタル ビデオ コーデック形式のグループの総称であり、Windows Media アーキテクチャの一部です。元々は、低レートのストリーミング メディア アプリケーション用の独自のコーデックとして開発されましたが、2003 年に Microsoft が Windows Media Video バージョン 9 コーデックに基づいてビデオ コーデック仕様を草案​​し、標準として適用するために SMPTE に提出しました。この標準は 2006 年 3 月に SMPTE 421M として正式に承認されたため、Windows Media Video 9 コーデックは独自のテクノロジではなくなりました。以前のトランスコードされたバージョン (7 および 8) は、SMPTE 421M 標準の対象になっていないため、依然として独自のものとみなされます。

MicrosoftのメディアシリーズはWMV(Windows Media Video)とWMA(Windows Media Audio)に分かれており、端的に言えばMicrosoftのビデオとオーディオです。

容器

ビデオ ストリームは通常、Windows Media Audio オーディオ ストリームと結合され、拡張子 .wmv または .asf を持つ Advanced Streaming Format ファイルを使用してカプセル化されます。WMV は通常、Advanced StreamingFormat (ASF) パッケージを使用しますが、AVI または Matroska 形式のパッケージも使用できます。AVI パッケージ化されたファイルの場合、結果ファイルは .avi、ASF パッケージ化された場合、.wmv または .asf、MKV パッケージ化された場合、.mkv になります。VirtualDub エンコーダと WMV9 VCM コーデックを実装すると、WMV を AVI ファイルに保存できます。Mac 用 Microsoft Media Player は、ASF ファイル パッケージ化のみをサポートしているため、すべての WMV エンコード ファイルをサポートしているわけではありません。Flip4Mac および QuickTime または MacOSX 用 MPlayer は、より多くのファイルを再生できます。

WMV

扩展名: .wmv
互联网媒体类型: video/x-ms-wmv
统一类型标识: com.microsoft.windows-?media-wmv
开发者: 微软公司
格式: 数字视频

WMV(Windows Media Video)是微软公司开发的一组数字视频编解码格式的通称,它是Windows Media架构下的一部分。它最初是为低速率流媒体应用作为专有编解码开发出来的,但是2003年微软公司基于Windows Media Video第9版编解码起草了视频编解码规范并且提交给SMPTE申请作为标准。这个标准在2006年3月作为SMPTE 421M被正式批准,这样Windows Media Video 9编解码就不再是一个专有的技术。早期的变解码版本(7和8)仍然被认为是专有技术,因为它们不在SMPTE 421M标准的涵盖范围内。

WMV不是仅仅基于微软公司的自有技术开发的。从第七版(WMV1)开始,微软公司开始使用它自己非标准MPEG- 4 Part 2。但是,由于WMV第九版已经是SMPTE的一个独立标准(421M,也称为VC- 1),有理由相信WMV的发展已经不像之前那样是一个它自己专有的编解码技术。现在VC-1专利共享的企业有16家(2006年4月),微软公司也是 MPEG-4 AVC/H.264专利共享企业中的一家。

正式名称

FourCC

Codec版本

描述

Windows Media Video v7

WMV1

0

Microsoft MPEG-4Video Codec v3

MP43

1

Windows Media Video v8

WMV2

2

Microsoft MPEG-4Video Codec v2

MP42

3

Microsoft ISO MPEG-4Video Codec v1

MP4S

4

Windows Media Video v9

WMV3

5

Windows Media ビデオ v9 アドバンスト プロファイル

WMVA

6

VC-1 には完全な互換性がないため、非推奨になりました。

Windows Media ビデオ v9 アドバンスト プロファイル

WVC1

7

VC-1完全サポート

FourCC の正式名は Four-Character Codes で、4 文字 (4 バイト) で構成されています。4 バイトの独立してマークされたビデオ データ ストリーム フォーマットです。これを説明するために、wav および avi ファイルに FourCC のセクションがあります。 AVI ファイル。エンコードに使用されるコーデックの種類。そのため、wavやaviには「IDP3」に相当するFourCCが多数存在します。

Microsoft MPEG-4 v1/v2/v3

MPEG-4 技術に基づいた共通バージョンは 1.0、2.0、3.0 の 3 つあり、このうち 3.0 は AVI エンコードには使用できず、「ビデオ ストリーミング」技術をサポートする ASF ファイルの生成にのみ使用できます。

Microsoft MPEG-4 バージョン 1 は
Microsoft の基本的なビデオ エンコードであり、非標準の MPEG-4 であり、MPEG-4 Part2 とは互換性がありません。4CC:MPG4

Microsoft MPEG-4 version 2
VFW的基础编解码。与V与MPEG-4Part2不兼容。VFW(Video for Windows),是微软推出的关于数字视频的一个软件开发包,VFW的核心是AVI文件标准。AVI(AudioVideo Interleave)文件中的音、视频数据帧交错存放。围绕AVI文件,VFW推出了一整套完整的视频采集、压缩、解压缩、回放和编辑的应用程序接口 (API)。由于AVI文件格式推出较早且在数字视频技术中有广泛的应用,所以VFW仍然有很大的实用价值,而且进一步发展的趋势。在VC++开发环境中 调用VFW和使用其它开发包没有什么不同,只是需要将VFW32.lib 文件加入工程中,但在开放视频捕捉与压缩管理程序时需要其它软件硬件设置。VFW为AVI文件提供了丰富的处理函数和宏定义,AVI文件的特点在于它是典 型的数据流文件,它由视频流、音频流、文本流组成。所以对AVI文件的处理主要是处理文件流。FourCC:MP42

Microsoft MPEG-4 version 3
VFW的基础编解码。与V与MPEG-4Part2不兼容。最终只用于ASF文件。FourCC:MP43

除此之外:
Microsoft ISO MPEG-4 version 1
基于DirectX Media Objects (DMO)-based编解码,与MPEG-4 SP(Simple Profile)兼容 。FourCC:MP4S。

Microsoft ISO MPEG-4 version 1.1
与MPEG-4 ASP(AdvancedSimple Profile)兼容。FourCC:M4S2

現在、Windows プラットフォーム上のより実用的な MPEG-4 ビデオ コーデックは主に次のとおりです: Microsoft によって開発された Microsoft MPEG-4 Codec v1/v2/v3 (主に Microsoft のストリーミング メディア テクノロジと組み合わせて使用​​されます)、Microsoft MPEG-4 On v3 に基づいて、DivXNetworks によって開発された DivX コーデック、OpenDivX に基づいて、GPL によって開発されたオープン ソースの XviD コーデックに従います。
これらのコーデックは Windows では DLL として表示されます。

Windowsメディアビデオ7

これは、DirectXMedia Objects (DMO) ベースのコーデックです。Microsoft が正式に開発した最初の Windows Media Video は MPEG-4 からの離脱を開始しており、MPEG-4 との互換性はありませんでしたが、この点からも Microsoft の野心を見ることができます (Microsoft は独自の非標準 MPEG-4Part 2 を使い始めました) 。このバージョンの圧縮効果は非常に悪く、Microsoft の空に舞い上がる夢を打ち砕いたのは残念ですが、圧縮速度は非常に速く、現在インターネット上にはこの形式で圧縮された WMV が多数あります。フォーCC:WMV1

Windows Media ビデオ 8

WMV7 の改良版をベースとしているため、品質はあまり向上していません。DMOベ​​ースのコーデックです。FourCC:WMV2。

Windowsメディアビデオ9

Microsoft のハイライトは、このエンコードだけでなく、V9 シリーズがプラットフォームであることにより、MPEG や ITU などの標準化団体に対抗するのに十分な能力を備えていることです。このバージョンは、特に低ビット レートで Microsoft ほどうるさくはありませんが、それでも前のバージョンと比較するとかなりの進歩があります。特に、WMV HD の適用により、マイクロソフトはビデオ標準の分野に参入することができました。
DMO ベースのコーデック、Video for Windows (VfW/VCM) バージョンも利用可能 FourCC: WMV3

Windows Media ビデオ 9 アドバンスト プロファイル

在WMV4的Simple和Main profile levels与VC-1标准中的是相同的。VC-1中的AdvancedProfile采用一个新的WMV编解码,称为WindowsMedia Video 9 Advanced Profile。它提高隔行扫描的内容压缩,并与传输无关,使得他可以封装在MPEG的传输流(TS)中或者采用RTP传输。它与之前的WMV9的 codec是不兼容的。

随着 Windows Media Player 10 推出的编码器,能够更进一步控制WMV9 的质量。但是不能在老版本的 WMP9 上播放,也就是不兼容老版本的 WMP9,真不知微软在搞什么?

FourCC:WVC1,VC-1兼容。FourCC:WMVA,不推荐使用非VC-1兼容方式。我们可以认为WMV9与VC-1兼容。

Windows Media Video 9 Screen

静态屏幕无损压缩编码,质量非常好,压缩率高,只针对如屏幕等变化非常小的环境。WMV Screen是一个screencast编解码器,它可以捕抓动态的屏幕内容,将第三方抓屏程序转换到WMV9 Screen文件中。用于之一是计算机的step-by*step演示视频,第一版本是WMV7 Screen,第二个版本也就是当前的版本是WMV9 Screen,支持CBR和VBR。

Windows Media Video 9 Image

静态图像压缩编码。WMV Image是一个视频幻灯片的编码器,播放多个画面时可根据时间进行平移和过度效果展现。与WMV9相比,具有高压缩率和高态图像质量。由于编解码依赖解 码器(播放器)生成实施视频帧,播放WMV Image文件(即使在普通的1024×768,30fps)要求很高的处理能力。在最新的版本,WMV9.1 Image,使用Photo Story3提高转换效果,耽于原来的WMV9 Image不兼容。

视频质量

Microsoft は、WMV9 は MPEG-4 の 2 倍、MPEG-2 の 3 倍の圧縮率を実現すると主張しています。Microsoft はまた、WMV9 の圧縮効率は WMV8 よりも 15% ~ 50% 高いと主張しています。しかし、2005 年のテスト報告では、WMV9 の圧縮効率が WMV8 よりも悪いことが示されました。

Windows Media Player 10 モバイル

Wiki には「Windows Media Player 10 Mobile」という記述があり、WMV10 がモバイル (おそらく Windows Mobile) に使用されることを示しています。しかし、それ以上の情報は見つかりませんでした。

WMA

拡張子 .wma
インターネット メディア タイプ audio/x-ms-wma
統一タイプ識別子 com.microsoft.windows-?media-wma
開発者 Microsoft
フォーマット デジタル オーディオ

WMA (Windows Media Audio) は、Microsoft Corporation によって開発されたデジタル オーディオ圧縮形式です。Windows Media オーディオ エンコード形式を使用してすべてのコンテンツをエンコードするオーディオ専用 ASF ファイルの中には、拡張子として WMA を使用するものもあります。WMA 形式は Microsoft 独自のものですが、Apple の iTunes が WMA 形式をサポートしているため、この形式は MP3 形式の競合となりつつあります。MP3 の ID3 メタデータ タグと互換性があり、追加のタグもサポートしています。

WMA は、さまざまな形式のエンコードされたファイルで使用できます。アプリケーションは Windows MediaFormat SDK を使用して、WMA 形式をエンコードおよびデコードできます。WMA をサポートする一般的なアプリケーションには、Windows Media Player、Windows Media Encoder、RealPlayer、Winamp などが含まれます。Linux やモバイル デバイスのハードウェアおよびソフトウェアなど、他の一部のプラットフォームもこの形式をサポートしています。

WMA 7以降のWMAは証明書暗号化に対応しており、許可がなければ(つまりライセンス証明書がなければ)ローカルエリアに不正コピーされても聞くことができません。同時に、マイクロソフトが冒頭で発表した、同じファイルサイズでMP3の2倍小さいが、音質は変わらないということも実現している。さらに、Microsoft は WMA 9 でエンジンを大幅に改良しました。実際、同じファイルと音質で MP3 の音量を約 1/3 に減らすことができるため、ネットワーク ストリーミング メディアに非常に適しています。

WMA は MP3 と比較すると高音質の描写能力が明らかに不足しており、MP3 よりも劣っており、通常の WMA も MP3 と同様に非可逆圧縮のファイル形式であり、より高い要求を求めるユーザーにとっては適した形式ではありません。 。しかし、WMA9 バージョンでは、可逆圧縮 - Windows Media Audio 9 Lossless のサポートが開始されました (WMP11 または Windows Media Format 11 をインストールした後に 9.1 にアップグレードすると、可逆圧縮バージョンは最大 5.1 チャネルのエンコーディングをサポートします)。また、WMAもMP3と同様に特許と著作権のあるファイル形式です。サポートされているデバイスを使用するには、ライセンスを購入する必要があります。

Windows Media オーディオ v1/v2

ASF で使用されていた Microsoft の初期のオーディオ コーディング テクノロジは、後にクラックされて DivX Audio で使用されましたが、品質は比較的劣っています。

Windowsメディアオーディオ7/8/9

さまざまな WMV 用のさまざまなオーディオ コーデックの導入により、品質は着実に向上していますが、64kbps CD の音質の神格化にはまだ達していません。

Windows Media オーディオ 9 プロフェッショナル

WMA9 で登場した新しいエンコーディングは、主にマルチチャンネル エンコーディングと高サンプリング レート オーディオのエンコーディングに使用され、品質は良好です。

Windows Media オーディオ 9 音声

音声符号化の場合は最大20kbpsですが、AMRと比べると効果があまりにも貧弱です。

Windows Media オーディオ 9 ロスレス

ロスレス オーディオ コーディングは CD の元の品質を完全に保存できるため、CD バックアップには適していますが、価格が高すぎます。

VC-1

VC-1、正式名 VC-1 ビデオ コーデック (ビデオ コーデック 1) は、Microsoft WMV9 に基づいており、業界標準として推進されています。2003 年に標準化申請が行われ、最初の名称は VC-9 で、2006 年 4 月に正式に規格として承認されました。VC-1 は、SMPTE 421M ビデオ コーデック規格の正式名称です。HD DVD と Blu-ray ディスク (Blu-ray Disc) は両方とも VC-1 をサポートします。Microsoft は、Windows Vista が HD DVD 仕様の VC-1 ビデオ圧縮テクノロジをサポートすると発表しました。映画テレビ協会 (SMPTE) は、ビデオ圧縮規格として VC-1 を採用しました。

VC-1 は、Windows Media Video 9 圧縮テクノロジに基づく画像圧縮規格であり、3 つの主要なコーデック コンポーネントで構成され、各コーデック コンポーネントには独自の FourCC コードがあります。

WMV3 :

つまりWMV9です。VC-1 のシンプル プロファイルとメイン プロファイルは WMV3 アプリケーションであるため、WMV 9 と互換性があり、プログレッシブ スキャン コーデックをサポートします。インターレース コーデックも使用できますが、Microsoft が WMVAdvanced プロファイルを発表した後、すぐに推奨されなくなりました。YUV4:2:0 にはプログレッシブ コーデックが使用され、YUV4:1:1 にはインターレース (非推奨) コーデックが使用されます。

WMV3 は、高品質のビデオとストリーミングに使用されます。同じ品質でも、MPEG-2 の帯域幅のわずか 1/2 ~ 1/3 です。WMV HD は、高解像度の映画やビデオに商業的に使用され、WMV3 Main Profile @ High Level (MP@HL) としてエンコードされます。

ウィムヴァ:

これは、WMV Advanced Profile が VC-1 ドラフトとして SMPTE に吸収されるまでの間に発生しました。WVC1 とは若干異なるため、デコーダーも異なりますが、2006 年以降、WMMA は VC-1 と完全な互換性がないため、廃止されたエンコーディングとみなされています。

WVC1:

それが WMV 9 Advanced Profile であり、最新の完全準拠の Advanced Profile VC-1 エンコード標準を実装しています。基礎となるトランスポートとは独立して、インターレース コンテンツをサポートします。

圧縮技術は MPEG と H.264 の利点を統合し、Biliner と Bicubic 方式を採用し、最小サブピクセル (Sub-Pixel) はピクセルの 1/4 に達します。VC-1は動き補償(動き合成)が4種類しかなく、圧縮率もH.264を超えることはできません。VC-1 は、H.264 に比べて圧縮時間が大幅に短く、圧縮率も H.264 の約 50% にとどまるため、特殊効果動画に優れた性能を発揮します。H.264 では、より小さいサイズの変換式と調整できない量子化マトリックスが使用されるため、画像の高周波の詳細を完全に保存することはできません。

Wiki には VC-1 と H.264 を比較する記事があり、読む価値があります。次のようなセグメントが表示されます。

VC-1: 料金がかかります。リファレンス デコーダは無料ではありませんが、外部ファイルが付属しています

H.264: 無料、リファレンス エンコーダとデコーダも無料です。さらに、検証チームと M4IF メーリング リストが利用可能で、AVC 関連の質問への回答が得られます。

さらに、Google の H.264 ライセンスの検索でもフリーという単語が見つかりました。しかし、そうですか?

著作権の問題

私は H.264 は有料である必要があると常々思っているので、上記の記述が正しいかどうかはわかりません。ネットで調べてみると、「H.264の基本システムは著作権を使用する必要がなく、オープンな性質を持ち、IPや無線ネットワークの利用にも十分適応できる」という言葉も見かけました。こうした疑問をもとに、ネットで調べてみました。知財は常に厄介な問題ですが、Andriod のようにプラットフォーム、著作権、製品の保守を提供するのが最善であり、それは携帯電話メーカーの責任です。

MPEG LA は、世界をリードする代替技術ライセンス サービス プロバイダーであり、ユーザーが各項目を個別に交渉するのではなく、単一の取引を通じて複数の特許保有者から特定の技術標準またはプラットフォームに必要な世界特許権を購入できるようにします。独立して管理されるワンストップ特許ライセンスが利便性の扉を開き、ユーザーが特定の技術を促進するのに役立つ限り、MPEG LA が開拓したライセンス モデルは解決策を提供できます。MPEG LA のフランチャイズの 1 つは MPEG-2 デジタル ビデオ圧縮です。この技術は、家庭用電化製品の歴史の中で最も広く使用されている標準の作成に貢献しました。MPEG-2 特許ポートフォリオ フランチャイズには、57 か国の 870 を超える MPEG-2 必須特許が含まれており、少なくとも 1,500 のライセンシーがあり、現在世界市場に流通している MPEG-2 製品 (セットトップ ボックス、DVD プレーヤーなど) のほとんどをカバーしています。 、デジタル TV プレーヤー、パーソナル コンピューター、DVD ビデオ ディスクなど。独立したフランチャイズ マネージャーとして、MPEG LA は標準管理団体と提携しておらず、特許所有者とも提携していません。詳細については、http://www.mpegla.com をご覧ください。(http://www.dvbcn.com/2010-01/28-44547.html)

MEPG-LA に行ってオンラインで確認したところ、AVC/H.264 があることがわかり、これは有料であることがわかりました。データには以下のPPTがあります。:

よく分からないのですが、例えばH.264動画の場合、ダウンロードした動画を提供するコンテンツプロバイダーが料金を支払うのか、それともデコーダーを提供する端末機器メーカーが料金を支払う必要があるのでしょうか?別の例として、ビデオ通話に H.264 を使用すると、12 分未満は無料、12 分を超えると料金がかかります。混沌。したがって、知的財産問題を担当する専門の法律家に任せた方がよいでしょう。

コーデック学習記(8):リアルシリーズ
以下の情報はwikiより取得しました。

Real シリーズは RealNetworks によって提供されており、RealVideo と RealAudio に分かれています。

リアルビデオ

RealVideo是一种影片格式由RealNetworks于 1997年所开发,至2006年时已到RealVideo版本10。它从开发伊始就定位为应用为网络上视频播放上的格式。支持多种播放的平台,包含 Windows、Mac、Linux、Solaris以及某些移动电话。相较于其它的视频编解码器,RealVideo通常可以将视频数据压缩得更小。因此它可以在用56Kbps MODEM拨号上网的条件实现不间断的视频播放。

一般的文件扩展名为.rm/.rvm,现在广泛流行的是rmvb格式,即动态编码率的real video。

RealVideo早期使用H.263,在RealVideo8及之后公司采用私有或者不公开的视频格式。官方的的播放器是 RealNetworks RealPlayer SP,最新的版本是v12,在多个平台,包括Windows,Macintosh,和Linux中提供。RealNetworks公司同时也开发了开源的 Helix播放器,但是在Helix项目中没有提供RealVideo,因为Real系列的编解码仍是不公开的。

RealMedia文件可以通过RTSP在网络上传输,但是RTSP只用于建立和管理连接,真正的视频数据是通过 Real自己私有的 RDT(Real Data Transport)协议传输。这种方式引起很大的批评,因为难以在其他播放器和服务器中使用RealVideo,现在一些开源项目,例如MPlayer 已经可以播放RDT流。为了支持实时流,RealVideo和RealAudio通常采用CBR(恒定码速)编码,使得每秒传递的数据相等。后来,公司开发了可变码速,成为RealMedia Variable Bitrate(RMVB),提供更高的水平资料,但是这种格式不适合作为流,因为难以预测某个特定的媒体流需要多少网络资源。带有快速移动和场景变化的视频需要更高的码流,如果码流超出网络所能提供的速率,将会引起中断。

RealNetworks公司说RealVideo和RealAudio编解码的源代码不在RPSL的许可内。在许可源代码在不支持的处理器和操作系统的商用移植中许可。虽然公司拥有大多数的知识产权,但是允许第三方为某个特性享有版权。

RealVideo 1.0

RealVideo的第一个版本在1997年释放,是基于H.263格式。在RealPayer5中提供。FourCC为rv10,rv13

RealVideo G2和RealVideoG2+SVT

也是就要H.263,在RealPlayer6中提供。质量比较糟糕。FourCC为rv20

RealVideo 8

随着 RealPlayer 8 推出的视频格式,是现在主流的网络视频编码之一。编码速度较慢,质量也只能算一般。猜测是基于早期的H.264 draft,在RealPlayer 8中提供,FourCC为rv30。

RealVideo 9

RealNetworks 开 发的新一代编码,质量进步了很多,特别是在底码率下,而且编码速度很快,做到了速与质的很好统一。
猜测是基于H.264,在RealPlayer9中提供。FourCC为rv40.

RealVideo 10

在RealVideo 9 基 础上加入了一些参数,如 EHQ 等,更加精确控制码率,和 RealVideo 9 兼容。在RealPlayer10中提供,FourCC为rv40(与RealVideo9相同)

RealAudio

文件名扩展: .ra, .ram

Internet media type:audio/vnd.rn-realaudio,audio/x-pn-realaudio

RealAUdio是RealNetwoks公司私有的宾朋编解码格式,最早在1995年释放。它包括一系列的音频编解码,从古老拨号modem的 低速率格式到高质量的音乐。可用于媒体流,过去很多的互联网电台使用RealAudio作为他们节目的实时音频流,近年使用得较少,让位与其他流行的格 式。

RealAudio ファイルの拡張子は .ra です。1997 年に、同社は RealVideo として知られる形式でビデオの提供を開始しました。オーディオとビデオのマージは、コンテナーの接尾辞 .rm です。ただし、最新バージョンでは、オーディオ ファイルには .ra、オーディオの有無にかかわらずビデオ ファイルには .rv、可変レート ビデオ ファイルには .rmvb が使用されます。

.ram (Real Audio Metadata) および .smil (Synchronized Multimedia Integration Language) ファイル形式は、ストリーミング メディアのリンクに使用されます。多くの場合、Web は RealAudio ファイルに直接リンクしているのではなく、.ram および .smil ファイルにリンクしています。これは、オーディオ ストリームへのリンクを含む小さなテキスト ファイルです。ユーザーがリンクをクリックすると、Web ブラウザーは .ram および .smil ファイルをダウンロードし、ユーザーのメディア プレーヤーをロードします。メディア プレーヤーはファイルから pnm または rtsp URL を読み取り、ストリームの再生を開始します。

RealAudio ファイルには複数のオーディオ コーデックが含まれており、各コーデックは次のように FourCC (4 文字コード) で表されます。

lpcJ: IS-54 VSELP (RealAudio 1)
28_8: G.728 LD-CELP (RealAudio 2)
dnet: Dolby AC3 (RealAudio 3)
sipr: Sipro Lab Telecom ACELP-NET (RealAudio 4/5)
Cook: G2/Cook Codec (RealAudio 6)
atrc: Sony ATRAC3 (RealAudio 8)
raac: MPEG-4 LC-AAC (RealAudio 9)
racp: MPEG-4 HE-AAC (RealAudio 10) ralf: RealAudio Lossless Format
(RealAudio 10)拡張子 .mov、.qtインターネット メディア タイプ ビデオ/クイックタイムタイプ コード MooV統合タイプ識別 com.apple.quicktime-movie開発者 Apple Inc形式のオーディオ、ビデオ、テキスト専用のメディア コンテナ







あるいは、タイトルを Apple シリーズに変更することもできます。QuickTime はエンコーディングではなく、マルチメディア プラットフォームです。QuickTime には多くのエンコーディングがありますが、ここでは主流のエンコーダーをいくつか紹介します。
  QuickTime テクノロジーには 3 つの主要コンポーネントがあります。

メディア プレーヤーである Apple Computer は、自社の Web サイトから無料でダウンロードでき、コンピューターに組み込まれています。
QuickTime ファイル形式 - 公開ファイルであり、ロイヤルティなしで誰でも利用できます。
ソフトウェア開発ツールは、Macintosh プラットフォームと Windows プラットフォームで利用できます。これらのツールを使用すると、QuickTime やその他のメディア ファイルを操作するための独自のソフトウェアを開発できます。登録開発者はこれらを無料で利用できます (登録は無料です)。
  Apple は、Mac OS および Windows 用の無料の公式メディア プレーヤー ソフトウェアを「QuickTime Player」という名前でリリースしています (以前のバージョンでは単に「MoviePlayer」という名前が使用されていました)。プレーヤーにはいくつかのメディア編集機能とメディア作成機能も含まれていますが、ユーザーはこれらの機能を有効にしてプレーヤーを「QuickTimePro」にするには、Apple からシリアル キーを購入する必要があります。

QuickTime の歴史: 1991 年から 1998 年: 1.x-2.x

Apple Computer は、1991 年 12 月 2 日に、System 7 のマルチメディア アドオンとして QuickTime の最初のバージョンをリリースしました。QuickTime の主任開発者である Bruce Leak は、1991 年 5 月の Worldwide Developers Conference で初めて公開プレゼンテーションを行いました。1984 年の Apple Computer の有名な TV コマーシャルでの Mac の放映は、当時としては印象的な進歩でした。Microsoft の競合テクノロジである Video for Windows は、1992 年 11 月まで存在していませんでした。

QuickTime の最初のバージョンで策定された基本アーキテクチャは、複数のムービー トラック、スケーラブルなメディア フォームのサポート、オープン ファイル フォーマット、完全な編集機能など、現在に至るまで基本的に変わっていません。元のビデオ コーデックには次のものが含まれています。

Apple ビデオ コーデック (「ロード ピザ」とも呼ばれる)。一般的な実写画像に適しています。
アニメーション コーデックは、漫画の形状の広い領域の色に適した、単純なランレングス グラフィックス圧縮方法を使用します。
グラフィック コーデック。ディザリング en:dithering を使用したグラフィックを含む、ピクセルあたり 8 ビットの画像用に最適化されています。
  Apple Computer は 1992 年末に Mac オペレーティング システムのバージョン 1.5 をリリースしました。

Apple Computer は、1994 年 2 月に Mac OS 用の QuickTime 2.0 をリリースしました。これは無料ではない唯一のバージョンでした。このバージョンでは、音楽トラックのサポートが追加されました。音楽トラックは MIDI データに相当します。この機能は、QuickTime (使用されるサウンド ライセンスは Roland からのものです) または任意の外部 MIDI デバイスでサウンド合成エンジンを駆動してそれ自体を作成できます。そのため、作成された音声は動画データのほんの一部にすぎません。

次のバージョン 2.1 および 2.5 でも、QuickTime は引き続き無料でした。エンジニアは音楽のサポートを改善し、スプライト トラックを追加しました。これにより、静止画像よりわずかに大きいファイル サイズで複雑なアニメーションを作成できるようになります。

Windows 用 QuickTime 2.0 は 1994 年 11 月にリリースされました。

QuickTime の歴史: 1998 ~ 2001: 3.0 および 4.0

Mac OS 上で動作する QuickTime 3.0 は、1998 年 3 月 30 日にリリースされました。既存の機能は無料ですが、より多くの機能を備えた Apple の QuickTime Player および Picture Viewer プログラムを入手したい場合、エンド ユーザーはソフトウェアの制限を解除するために QuickTime Pro ライセンスを購入する必要があります。

QuickTime 3.0 には、画像のインポートをサポートするコンポーネントが追加されており、GIF、JPEG、TIFF、およびその他のファイル形式から画像を読み込むことができます。ビデオ出力コンポーネントは、主に FireWire を介したビデオ データ出力として使用され、視覚効果も追加するため、プログラマーはリアルタイム テクノロジをビデオ トラックに適用できます。一部のエフェクトは、映画自体のインタラクティブなサポートと同様に、ユーザーのマウス クリックに応答することもできます。

Apple は 1999 年 6 月 10 日に Mac OS 用の QuickTime 4.0 をリリースしました。(おそらく LZW ライセンスのため) プリインポーターが読み取ることができるのと同じ形式で非 GIF 形式へのエクスポートをサポートする画像エクスポート コンポーネントが追加されます。Sorenson ビデオ コーデックの最初のバージョンが追加され、ストリーミングがサポートされます。

QuickTime 4.1 は 2000 年の初めにリリースされ、Mac OS 9 以降のバージョンで 2G を介してムービーを再生する機能が追加され、68K Mac のサポートが終了しました。ユーザーは AppleScript 経由で QuickTime Player を操作できるようになります。

QuickTime の歴史: 2001 年 - 現在 5.0 以降
  Mac OS 用の QuickTime 5.0 は 2001 年 4 月 23 日に登場しました。「スキニング」機能とマルチプロセス画像圧縮サポートが追加されます。このバージョンでは、QuickTime Pro ライセンスを持つユーザーのみが全画面モードを使用できますが、このモードは物議を醸しており、今日まで解決されていません。

QuickTime の歴史: QuickTime 6.x
  2002 年 7 月 15 日にリリースされた Mac OS 用 QuickTime 6.0 には、Mac OS X で使用されるバージョンが最初に含まれていました。

QuickTime 6 にアップデートする

発売日

バージョン

プラットホーム

特徴

2002 年 7 月 15 日

クイックタイム6

Mac OS 8.6 – Mac OS X、Windows

MPEG-2、MPEG-4、および AAC

2003 年 1 月 14 日

クイックタイム6.1

Mac OS X

品質と性能の向上

2003 年 3 月 31 日

クイックタイム 6.1

ウィンドウズ

CAN-2003-0168 のセキュリティ脆弱性を修正

2003 年 4 月 29 日

クイックタイム 6.2

Mac OS X

iTunes 4のサポート、強化されたAACサポート

2003 年 6 月 3 日

クイックタイム 6.3

Mac OS X、Windows

3GPP と AMR

2003 年 10 月 16 日

クイックタイム 6.4

Mac OS X、Windows

Pixlet コーデック、統合 3GPP

2003 年 12 月 18 日

クイックタイム 6.5

Mac OS X、Windows

3GPP2 および AMC モバイル マルチメディア フォーマット

2004 年 4 月 28 日

クイックタイム 6.5.1

Mac OS X、Windows

アップルロスレス

2004 年 10 月 27 日

クイックタイム 6.5.2

Mac OS X、Windows (Windows 98/Me の最終バージョン)

バグ修正、セキュリティ更新、品質とパフォーマンスの向上

2005 年 10 月 12 日

クイックタイム 6.5.3

Mac OS X v10.2.8

QuickTime 履歴 QuickTime 7.x

QuickTime 7にアップデートしました。

QuickTime 7 にアップデートする

発売日

バージョン

プラットホーム

特徴

2005 年 5 月 31 日

クイックタイム 7.0.1

Mac OS X

Quartz Composer プラグイン モジュールに関するセキュリティ問題を修正

2005 年 7 月 15 日

クイックタイム 7.0.2

Mac OS X

バグ修正と互換性の改善

2005 年 9 月 7 日

クイックタイム 7.0.2

Windows2000/XP

最初の非プレビュー リリース

2005 年 10 月 12 日

クイックタイム 7.0.3

Mac OS X および Windows 2000 /XP

ストリーミングと H.264 のバグ修正。
iTunes Music Store を通じてサポートされているビデオを購入する必要があります。

2005 年 10 月 29 日

クイックタイム 7.0.3.50

Windows2000/XP

2006 年 1 月 10 日

クイックタイム 7.0.4

Mac OS X および Windows 2000 /XP

最初のユニバーサル バイナリ リリース。
多数のバグ修正と H.264 パフォーマンスの向上。

2006 年 5 月 11 日

クイックタイム 7.1

Mac OS X および Windows 2000 /XP

多数のバグ修正、iLife '06 サポート、H.264 パフォーマンスの向上

2006 年 5 月 31 日

クイックタイム 7.1.1

Mac OS X

2006 年 6 月 28 日

クイックタイム 7.1.2

Mac OS X

iDVD プロジェクトのプレビューの問題を解決します。

2006 年 9 月 12 日

クイックタイム 7.1.3

Mac OS X および Windows 2000 /XP

バグ修正と重大なセキュリティ問題。

現在、QuickTime の最新バージョンは QuickTime 7.6 ですが、Windows 2000 で使用できる最高バージョンは 7.1.6 です。7.5.5 より前のバージョンでは、クロスサイト スクリピングのセキュリティ上の問題があります。
QuickTime の歴史: QuickTime X

QuickTime X (QuickTime Ten と発音します。「X」はローマ数字の 10 です) は、2008 年 6 月 9 日の WWDC で発表された次世代の QuickTime です。この製品は、2009 年半ばに Mac OS X v10.6 とともに出荷される予定です [3]。バージョン X は iPhone OS と同じメディア テクノロジを使用し、新しいコーデックとより効率的なメディア再生をサポートします。
ソレンソンのビデオ

ソレンソンビデオ 2:

Sorenson Media によって開発されたエンコーダは、主に QuickTime 4 ビデオ エンコードに使用されており、品質は低いです。

ソレンソンビデオ 3:

Sorenson Media Company が QuickTime 5 とともにリリースしたコーデックは品質が非常に高く、QuickTime の標準ビデオ コーデックになっており、インターネット上のほとんどの映画予告編はこのコーデックを使用しています。

アップル MPEG-4

QuickTime 6 とともにリリースされた Apple 独自の MPEG-4 エンコーダは品質が低いです。

アップル H.264

QuickTime 7 とともにリリースされた Apple 独自の H.264 エンコーダは、HDTV をサポートします。

オーディオ Qデザイン ミュージック

Qデザインミュージック1

QDesign によって開発されたオーディオ エンコーダ、このバージョンは現在利用できません。

Qデザインミュージック2

QDesign Music の 2 番目で最後のバージョンであるこのバージョンは、今日の高度なオーディオ コーデックに直面すると活力がなく、主にインターネット上の映画の予告編で使用されています。

オーディオ Apple MPEG-4 AAC

Apple 自身が開発した AAC エンコーダは非常に高品質で、QuickTime 6 とともにリリースされた最高の AAC エンコーダの 1 つです。

アップルロスレス

Apple によって開発されたロスレス オーディオ コーディング。主に iTunes で CD をリッピングするために使用されます。Apple Lossless (AppleLossless Audio Codec、ALAC) は、Apple の可逆オーディオ圧縮エンコード形式です。iTunes では Apple Lossless と呼ばれています。

非圧縮オーディオ形式 (WAV、AIFF) を元の容量の約 40% ~ 60% に圧縮でき、エンコードとデコードの速度が非常に高速です。また、可逆圧縮であるため、元のファイルとまったく同じように聞こえ、解凍や圧縮によって音質が変化することはありません。

これは、iTunes 4.5 および QuickTime 6.5.1 の一部として 2004 年 4 月 28 日にリリースされました。現在、ポータブル デジタル マルチメディア プレーヤーの中で再生できるのは iPod のみです。

フリーソフトウェアやオープンソースソフトウェアではありませんが、Apple Lossless用のオープンソースコーデックがリリースされています。

注: 上記の資料は Wiki の照合に基づいています。

コーデック学習ノート (10): Ogg シリーズ
Ogg は、Xiph.Org Foundation によって管理されている無料のオープンな標準コンテナ形式です。Ogg フォーマットはソフトウェア特許による制限を受けず、高品質のデジタル マルチメディアを効率的にストリーミングおよび処理できるように設計されています。

Ogg は、オーディオ、ビデオ、テキスト (字幕など)、メタデータ処理など、さまざまな無料のオープンソース コーデックを組み込むことができるファイル形式を指します。

オッグセオラ

Theora は、Xiph.Org Foundation によって開発されたロイヤリティフリーのオープンフォーマットの非可逆画像圧縮技術です。Xiph.Org Foundation は、有名なオーディオ コーディング技術である Vorbis やマルチメディア コンテナ ファイル Ogg も開発しました。Theora は、オープン ソースを通じて On2Technologies 独自の VP3 エンコーダから派生したものです。Theora は、Max Headroom というテレビ番組にちなんで名付けられました。

Theora は、可変ビット レートの DCT ベースの画像圧縮フォーマットです。ほとんどの画像コーディング形式と同様に、Theora はクロマ サンプリング、ブロック ベースの動き補償、および 8×8 DCT ブロックを使用し、ビデオ圧縮画像タイプとビデオ圧縮画像タイプもサポートしていますが、H.264 および VC-1 bi の使用はサポートしていません。 -予測フレーム (B フレーム)、Theora はインターレース、可変フレーム レート、コンポーネントあたり 8 ビットを超えるビット深度もサポートしていません。

Theora の画像ストリームは任意のコンテナ ファイル形式で保存できますが、最も一般的に使用されるものは、オーディオ コード Vorbis とともに Ogg ファイル形式で保存され、完全にオープンでロイヤリティフリーのマルチメディア ファイルを提供できます。さらに、Theora イメージは Matroska アーカイブに保存することもできます。

Google の公式ブログによると、現在、Web ビデオの標準は存在しません。一部の Web サイトでは Flash が使用されていますが、これにはユーザーが Flash プレーヤーを持っている必要があり、一部の Web サイトでは Java プレーヤーが使用されていますが、ユーザーは高度に構成されたマシンが必要です。

幸いなことに、次世代の HTML 5 標準では video 要素が導入され、Web 開発者は標準的な方法でビデオの外観を指定できるようになりました。ここで、どのビデオ形式を使用するかが問題になります。

Google は、オープンスタンダード形式が現在の組織化されていないビデオ形式の戦いにおいて最終的な利益をもたらす可能性があると信じています。最後の特典スキームには、最も複雑な形式や最も派手な形式は必要なく、ほぼ業界標準の形式であるため、広く使用されているオープン ソースの Ogg Theora 形式をサポートすることを選択することにしました。

Theora は、Google が昨年買収した On2 Technologies の VP3 エンコーダのオープンソース派生製品です。

出典: http://tech.it168.com/a2010/0412/872/000000872493.shtml

2002 年 3 月、On2 はライセンスを LGPL に変更しました。2002 年 6 月、On2 は、Xiph.Org 傘下で VP3 を BSD のようなオープン ソース ライセンスとしてリリースしました。On2 はまた、誰もがあらゆるソフトウェア、あらゆる派生製品、あらゆる目的を使用できるという、変更不可能な著作権フリーの声明を策定しました。2002 年 3 月、On2 は Xiph.Org と契約を結び、新しい無料ビデオ コーデックとして VP3 を導入し、それが Theora となりました。On2 は、Theora が VP3 の後継であると主張しています。2002 年 10 月 3 日、On2 と Xiph は Theora の最初のアルファ コードのリリースを発表しました。

ビットストリーム形式は 2004 年に凍結され (バージョン 1.0 alpha3)、数年間のベータ版を経て、Theora の最初の安定バージョン (v1.0) が 2008 年 11 月にリリースされました。Theora ビデオ エンコーディングのどのバージョンも、フォーマット フリーズ後の将来のプレーヤーと互換性があります。現在の作業は、現在ベータ版である「Thusnelda」ブランチのバグ修正に焦点を当てており、最終的には Theora 1.1 としてリリースされる予定です。

Theora ビデオ圧縮形式は、下位互換性のあるスーパーセットを含め、基本的に VP3 ビデオ圧縮形式と互換性があります。Theora は VP3 および VP3 ストリームのスーパーセットです (構文が若干変更されています)。VP3 ストリームは再圧縮せずに Theora ストリームに変更できますが、その逆も同様です。VP3 ビデオ圧縮は Theora でデコードできますが、Theora ビデオ デモは通常、古い VP3 を使用してデコードできません。

Theora はオープンソース基盤に基づいたビデオ形式であり、kipedia ビデオ コンテンツに最適なエンコード形式として機能します。しかし、Theora には商用サポートが不足しており、再販業者、特にネットワーク再販業者からの受け入れを得るのに苦労しています。

Mozilla は、このテクノロジーを使用して Firefox で HTML5 ビデオを提供します。Apple と Microsoft は、HTML5 ビデオに MPEG LA が管理する H.264 を採用する準備を進めています。このグループのメンバーには、マイクロソフトやアップルなど多くのテクノロジー企業が含まれています。

この論争の鍵はライセンスの問題にあり、H.264 にはライセンスが必要です。

Mozilla は次の声明を発表しました:「HTML5 ビデオは、W3C ライセンス標準と同様に、マルチパーティでオープンかつロイヤリティフリーのコーデックによってサポートされている場合にのみ、公共の利益にかなうと考えています。もし MPGA LA が「H.264 は W3C 標準に従って定義することに前向きです。H.264 はオープンな条件のウェブで利用可能であり、私たちはこのテクノロジーの採用を間違いなく検討します。組織は Theora に関する私たちの立場を支持しています。」

Opera の CTO である Hakon Wium Lie 氏も次のような声明を発表しました; 「オープン Web が繁栄するには、コーデックのライセンス料を支払わずにすべてのメディア (ビデオを含む) が利用可能でなければなりません。オープン Web を真にサポートするブラウザ メーカーは、次のことに努めなければなりません。」ライセンス料なしで基本的な AV コーデックを構築できます。」

Microsoft の企業ブログには次のように書かれています。「ソース コードの入手可能性と知的財産権の違いは、ソース コードの入手可能性が非常に必要であるということです。現在、H.264 の知的財産権は MPEG LA Clear の定義を通じて管理できます」スキームの取得。他のコーデックの権利は、多くの場合、明確ではありません。」

オッグ・ヴォルビス

Ogg のオーディオ エンコーディングは、特に低ビット レートで優れた品質を備えており、マルチチャネルをサポートしています。最高ビットレートは 500kbps に達する可能性があり、AAC の強力な競合相手となります。

「Ogg」という用語は通常、Ogg Vorbis のオーディオ ファイル形式、つまり、Vorbis でエンコードされた音響効果が Ogg コンテナに含まれる形式を指します。以前は、拡張子 .ogg は、Ogg がサポートする形式のコンテンツに使用されていましたが、2007 年に、Xiph.Org Foundation は、下位互換性を考慮して、Vorbis 形式に対してのみ .ogg を残すよう要求しました。Xiph.Org Foundation は、さまざまな種類のコンテンツを記述するために、いくつかの新しい拡張子とメディア形式を作成することを決定しました。たとえば、サウンドエフェクトのみの .oga、サウンドの有無にかかわらず映画の .ogv (Theora を含む)、プログラムの .ogx などです。

Vorbis は、Xiph.Org Foundation が主導するオープンソースのフリー ソフトウェア プロジェクトです。このプロジェクトは、不可逆オーディオ圧縮のためのデジタル オーディオ形式の仕様とソフトウェア実装 (コーデック) を作成します。Vorbi は、Ogg コンテナ形式と組み合わせて最も一般的に使用されるため、Ogg Vorbis 形式と呼ばれることがよくあります。

Vorbis は、1993 年に Chris Montgomery によって開始されたオーディオ圧縮開発の継続です。フラウンホーファー協会への書簡で、同社が MP3 オーディオ フォーマットのライセンス料を請求すると発表した後、1998 年 9 月に集中的な開発が始まりました。Vorbis プロジェクトは、Xiph.Org Foundation の Ogg プロジェクト (OggSquish マルチメディア プロジェクトとしても知られる) の一環として開始されました。Chris Montgomery はプロジェクトに取り組み始め、ますます多くの他の開発者を支援しました。彼らは、2000 年 5 月に Vorbis ファイル形式が 1.0 で凍結され、リファレンス ソフトウェアの安定バージョン (1.0) が 2002 年 7 月 19 日にリリースされるまで、ソース コードの改良を続けました。

オッグスピード

Ogg の音声コーディング。特に低ビット レートの音声コーディングに適しています。

オッグ FLAC

Ogg のロスレス オーディオ エンコーディング。

On2 VPXシリーズ

On2 は一連の優れたビデオ コーデックを開発しており、最も広く使用されているのは、VP3、VP5、および VP6 ビデオ コーデックを使用する NullsoftVideo のビデオです。

VP3

すでにオープンソースとしてリリースされており、現在は Ogg Theora プロジェクトとなっており、もちろん Theora の品質は VP3 よりもはるかに優れています。

VP4

On2 は世界最高のビデオ エンコーディングを誇っていましたが、品質は平凡であることが判明しました。

VP5

至今还很神秘,On2 并没有放出来,只在 NullsoftVideo 里面见到他的身影。

VP6

从一开始,On2 就把这个编码器提供给大家下载,质量还是不错的。不过最近似乎又关闭了,主页上只有一个解码器。On2 TrueMotion VP6是一个专有的有损视频编解码格式和视频编解码器。它是TrueMotion视频编解码的具体体现,是一系列由On2开发的视频编解码,通产个用于 Adobe flash,Flash Video和JavaFX媒体文件。

VP7

On2 最新的编码器,在 VP6 上有不少进步。在2005年1月,On2宣布推出比VP6有更好的压缩比的新的编解码VP7。在2005ian4月,On2公司许可On2视频编码器9包 括VP6和VP7)用于Macromedia Flash。在2005年8月,Macromedia宣布他们选择VP6作为新的Flash Player8的视频回放的旗舰式编解码。

VP8

Google在2009年收购了On2 Technologies,并于2010年5月19日在Google I/O会议上宣布将VP8以BSD许可证的形式开源。。VP8是On2 Technologies继VP3之后宣布开源的第二个编解码器。(Xiph.Org 基金会于2002年接手VP3并将之冠名以Theora,之后以BSD许可证的形式将Theora开源)。要求Google将VP8开源的最大呼声来自于 自由软件基金会。2010年3月12日,自由软件基金会给Google发了一封公开信,请求Google逐渐用开源形式的VP8和HTML 5取代YouTube上的Adobe Flash和H.264。

2010年5月19日,WebM启动。WebM包含了来自于Mozilla、Opera、Google以及其他四十多家出版商和计算机软硬件供 应商(包括AMD、NVIDIA)的贡献,旨在大力倡导在HTML5中使用VP8。InternetExplorer 9在安装了适合的编解码器之后也能支持VP8。

注: 上記の資料は Wiki の照合に基づいています。

コーデック学習ノート (11): Flash Video シリーズ
Flash でビデオを圧縮するために使用されます。FLV ストリーミング メディア形式は新しいビデオ形式であり、その登場により、ビデオ ファイルを Flash にインポートする際に、エクスポートされた SWF ファイルが大きくなり、インターネット上で効果的に使用できなくなるという欠点が効果的に解決されます。一般に、FLV ファイルは SWF PLAYER のシェルにパッケージ化されており、FLV は元のアドレスを非常によく保護でき、著作権を保護するためにダウンロードするのは簡単ではありません。

ファイル名:.flv、.f4v、.f4p、.f4a、.f4b
メディアタイプ:video/x-flv、video/mp4、video/x-m4v、audio/mp4a-latm、video/3gpp、video/quicktime、オーディオ/MP4
メーカー: Adob​​e Systems (当初は Macromedia によって開発)
形式の種類: メディア コンテナ
コンテナの対象: オーディオ、ビデオ、テキスト、データ 拡張元
: FLV: SWF、F4V: MPEG-4 Part 12
Flash はじめに

Flash Video は、Adobe Flash Player バージョン 6 ~ 10 でインターネット上でビデオを配信するために使用されるファイル コンテナ形式です。Flash ビデオ コンテンツを SWF ファイルにカプセル化することもできます。Flash ビデオには、FLV と F4V という 2 つの異なるファイル形式があります。FLV ファイルでは、オーディオ データとビデオ データが SWF ファイルと同じ方法でエンコードされます。後発の F4V は ISO ベースのメディアファイル形式をベースにしており、Flash Player 9 update 3 からサポートされ始めました。これらの形式は Adob​​e Flash プレーヤーでサポートされており、Adobe によって開発されていますが、その中で FLV は Macromedia によって最も多く開発されています。

Flash Video FLV ファイルに含まれるメディアは、通常、Sorenson Spark および VP6 ビデオ圧縮形式を使用してエンコードされます。Flash Player の最新リリースは、H.264 ビデオと HE-AAC オーディオをサポートしています。現在、これらのコーデックはすべて特許制限の対象となっています。

Sorenson コーデック 次の 2 つの専用ビデオ コーデックを参照してください: Sorenson Video または Sorenson Spark。Sorenson Video は、Sorenson Codec、Sorenson Video Quantizer、または SVQ とも呼ばれます。ソレンソン スパークは、ソレンソン H.263 としても知られています。これらのコーデックは、Sorenson Media (および以前は Sorenson Vision) によって設計されました。Sorenson Video は Apple の QuickTime で使用され、SorensonSpark は Adob​​e Flash (旧 Macromedia Flash) で使用されます。

Flash ビデオは、広く使用されている Adob​​e Flash プレーヤーやブラウザ プラグイン、またはその他のサードパーティ プログラムを通じて、ほとんどのオペレーティング システムで使用できます。

通常、Flash Video FLV ファイルには、独自の H.263 ビデオ規格のバリアントであるビデオ ビットストリームが含まれており、FourCC は FLV1 (Sorenson Spark) です。SorensonSpark は FLV ファイル用の古いコーデックですが、広く使用されており互換性があるため、Flash Player でサポートされる最初のビデオ コーデックです。これは、Flash Player 6 および 7 で必要なビデオ圧縮形式です。Flash Player 8 以降は、On2 TrueMotion VP6 ビデオ ビットストリーム再生 (FourCC VP6F または FLV4) をサポートします。On2 VP6 は、FlashPlayer 8 以降で推奨されるビデオ圧縮形式です。On2 VP6 は、特に低ビットストリームにおいて、Sorenson Spark よりも高い視覚品質を提供できます。さらに、計算がより複雑になるため、一部の古いシステム構成ではうまく機能しません。

2007 年 12 月 3 日にリリースされた Flash 9 アップデート 3 は、新しい Flash ビデオ ファイル形式 F4V を提供し、H.264 ビデオ標準 (MPEG-4part 10 または AVC) をサポートします。H.264 はより複雑なテクノロジを必要としますが、さらに優れた品質/ビットストリーム比。具体的には、Flash Player は、H.264 ビデオ圧縮 (MPEG-4 Part 10)、AAC オーディオ圧縮 (MPEG-3 Part 3)、F4V、MP4 (MPEG-4 Part14)、M4V、3GP および MOV マルチメディア コンテナー形式、3GPP をサポートするようになりました。 Timed Text 標準 (MEPG-4 Part 17) (これは、iTunes で使用されるメタデータ ストレージに相当する ID3'ilist' を部分的に解析できる標準字幕形式です。MPEG-4 Part 2 ビデオ (たとえば、Created Flash の主任プログラマーの 1 人である Jonathan Gay 氏は BBC ニュースに対し、同社は当初 Flash で H.264 を使用したいと考えていたが、年間 500 万ドル (350 万ポンド) の特許により阻止されたと語った。

Flash Video FLV ファイル形式は、デスクトップ プレゼンテーションに使用されるエンコード形式である 'screenshare' (スクリーン ビデオ) コーデックの 2 つのバージョンをサポートしています。どちらの形式も tmap タイリングに基づいており、色深度を減らすことで削減できます。非可逆エンコードと圧縮を使用します。 zlib。2 番目のバージョンは、Flash Player 8 以降でサポートされています。

Flash ビデオ ファイルでは通常、オーディオ コーデックとして MP3 が使用されますが、Flash ビデオ FLV ファイルでは、マイクを介した録音に専用の Nellymoser Asao コーデックが使用されます (Flash Player 10 は 2008 年にリリースされ、オープン ソースの Speex コーデックもサポートしています)。 。FLV ファイルは、非圧縮オーディオまたは ADPCM オーディオ形式をサポートしています。最新のFlahs Player 9はAAC(HE-AAC/AAC SBR、AAC Main Profile、AAC-LC)に対応しています。

Flash Video ファイルへのエンコードは、Adobe の Flash Professional および Creative Suite 製品、On2 の Flix エンコード ツール、SorensonSqueeze、FFmepg、その他のサードパーティ ツールなどのエンコード ツールによって提供されます。

容器

2002 年にリリースされた Flash Player6 では、SWF ファイル形式のサポートが追加されました。2003 年、FlashPlayer7 は FLV ファイル形式の直接サポートを追加しました。FLV ファイル形式の制限のため、Adobe System は 2007 年に、ISO 基本メディア ファイル形式 (MPEG-4 Part 12) に基づいた、以下に示す新しいファイル形式を提案しました。Flash Player はファイル拡張子をチェックしませんが、ファイルを直接調べて、それがどの形式に属しているかをチェックします。

ファイル拡張子

MIME タイプ

説明

.f4v

ビデオ/MP4

Adobe Flash Playerのビデオ

.f4p

ビデオ/MP4

Adobe Flash Playerの保護されたビデオ

.f4a

ビデオ/MP4

Adobe Flash Playerのオーディオ

.f4b

ビデオ/MP4

Adobe Flash Player 用オーディオブック

Flash Player6 以降のバージョンでの SWF ファイルのサポートにより、オーディオ、ビデオ、およびデータの RTMP を介して Adob​​e Flash メディア サーバーと対話できるようになります。Flash Media Server データは、FLV ファイル形式 (MIME タイプ video/x-flv) のファイルをサポートします。Flash Player 9 Update 3 以降で作成された SWF ファイルの場合、Flash Player は新しい F4V ファイル形式をブロードキャストできます。

メディアフォーマット

FLV ファイルでサポートされているメディア タイプ:

ビデオ: On2 VP6、Sorneson Spark (Sorenson H.263)、スクリーン ビデオ、H.264
オーディオ: MP3、ADPCM、リニア PCM、Nellymoser、Speex、AAC、G.711 (相互運用性要件のために予約) の
  F4V ファイルでサポートメディアタイプ:

ビデオ: H.264
画像 (ビデオ データの静止フレーム): GIF、PNG、JPEG
オーディオ: AAC、HE-AAC、MP3
Flash Player および Flash Video でサポートされるオーディオおよびビデオ圧縮形式

Flashプレーヤーのバージョン

リリースされました

ファイル形式

ビデオ圧縮形式

音声圧縮フォーマット

6

2002年

SWF

ソレンソン・スパーク、スクリーンビデオ

MP3、ADPCM、ネリーモーザー

7

2003年

SWF、FLV

ソレンソン・スパーク、スクリーンビデオ

MP3、ADPCM、ネリーモーザー

8

2005年

SWF、FLV

On2 VP6、ソレンソン スパーク、スクリーン ビデオ、スクリーン ビデオ 2

MP3、ADPCM、ネリーモーザー

9.0.115.0

2007年

SWF、FLV

On2 VP6、Sorenson Spark、スクリーン ビデオ、スクリーン ビデオ 2、H.264[*]

MP3、ADPCM、Nellymoser、AAC[*]

SWF、F4V、ISO ベースのメディア ファイル形式

H.264

AAC、MP3

10

2008年

SWF、FLV

On2 VP6、Sorenson Spark、スクリーン ビデオ、スクリーン ビデオ 2、H.264[*]

MP3、ADPCM、Nellymoser、Speex、AAC[*]

SWF、F4V、ISO ベースのメディア ファイル形式

H.264

AAC、MP3

[*] FLV ファイル形式での H.264 および AAC 圧縮の使用にはいくつかの制限があるため、Flash Player の作成者は新しい F4V ファイル形式を使用することを強く推奨しています。

Flash 配信のいくつかの方法

1 つは、標準の flv ファイルです。

2. SWF ファイルを埋め込み、Flash 認証ツールを使用します (FlashPlayer 6 以降のバージョンでサポートされています)。

3. HTTP 経由のプログレッシブ ダウンロード。このアプローチでは、ActionScript を使用し、再生用にクライアント側で外部でホストされている Flash ビデオ ファイルを組み込みます。ただし、RTMP を使用したメディア ストリーミングとは異なり、HTTP「ストリーミング」はリアルタイム ブロードキャストをサポートしません。HTTP ストリーミングには、カスタム プレーヤーと、各キーフレームの正確な開始バイト位置とタイムコードを含む特定の FlashVideo メタデータの追加が必要です。この特定の情報を使用して、カスタム Flash Video プレーヤーは、指定されたキーフレームで再生を開始するように要求できます。たとえば、Google Video、Youtube、BitGravity はプログレッシブ ストリーミングをサポートしているため、キャッシュがいっぱいになる前にビデオの任意の部分を表示できます。サーバー側では、この「偽の HTTP ストリーム」メソッドの実装は非常に簡単です。たとえば、Apache の PHP モジュールと lighttpd を使用できます。

4. RTMP プロトコルを使用したスト​​リームは、Flash Media Server (旧称 Flash Communication Server)、VCS、Electro Server、Helix Universal Serval、Wowza Pro、WebORB for .NET、WebORB for Java、およびオープン ソース Red5 サーバーによって提供できます。2008 年 4 月の時点で、このプロトコルはスクリーンキャスト ソフトウェアを再エンコードすることなくビデオのストリーミングに利用できます。

RTMP、リアルタイム メッセージ プロトコル、リアルタイム メッセージ プロトコルは、インターネット上のオーディオ、ビデオ、およびデータ ストリーム用に Adob​​e System によって開発された独自のプロトコルで、Flash プレーヤーとサーバーの間で実行されます。RTMP プロトコルには 3 つの方法があります。
1. TCP のポート 1935 を使用する「純粋な」プロトコル経由。
2. ファイアウォールを通過するときに、HTTP リクエストにカプセル化された RTMPT に使用されます。
3. HTTPS セキュア接続で使用される RTPMS。

注: 上記の資料は Wiki の照合に基づいています。

コーデック学習記(12):その他のコーデック
M-JPEG

M-JPEG (Motion-JoinPhotographicExpertsGroup) テクノロジーは、静止画 (またはフレーム単位) 圧縮テクノロジーであり、ノンリニア編集の分野で広く使用されており、フレーム編集や多層画像処理に正確に対応できます。この圧縮方式は、各フレームを個別に完全に圧縮し、編集プロセス中に各フレームをランダムに保存し、フレーム精度の編集を実行できます。また、M-JPEG の圧縮と解凍は対称的であり、同じハードウェアとソフトウェアで使用できます。実装。

同じフォーマットでの MPEG ビデオ圧縮は、フレーム間圧縮とは異なります。圧縮ビット レートが比較的低いため、エンコードとデコードが比較的簡単で、多くの計算能力を必要とせず、ソフトウェアやデコードが非常に簡単になります。 Motion JPEGを編集するためのチップ。このため、デジタル カメラなどの一部のモバイル デバイスでは、ビデオ クリップのエンコードに MotionJPEG を使用します。

モーションJPEG2000

JPEG2000 は、Joint PhotographicExperts Group によって作成および維持されている、ウェーブレット変換に基づく画像圧縮規格です。JPEG2000 は一般に、将来 JPEG (離散コサイン変換に基づく) に代わる次世代の画像圧縮規格であると考えられています。通常、JPEG2000 ファイルの拡張子は .jp2 で、MIME タイプは image/jp2 です。

JPEG2000 にはテクノロジー面で一定の利点がありますが、現時点 (2006 年) では、インターネット上で JPEG2000 テクノロジーを使用して生成された画像ファイルの数はまだ非常に少なく、ほとんどのブラウザーは依然としてデフォルトで JPEG2000 画像ファイルの表示をサポートしていません。ただし、JPEG2000 は可逆圧縮でも比較的良好な圧縮率を実現できるため、比較的高い画質が要求される医療画像の解析や処理に広く使用されています。

ディビジョン

ファイル名拡張子: .divx
タイプ: DIVX
開発者: DivX, Inc
形式の種類: MPEG-4 Part 2 準拠のビデオ用のメディア コンテナ 拡張子
ソース: AVI
  これは、MPEG-4 (圧縮) 標準から派生した別のビデオ エンコーディングであり、一般にとして知られています。 MPEG4 圧縮アルゴリズムを使用し、MPEG-4 および MP3 テクノロジーのすべての側面を統合する DVDrip フォーマット MP3 または AC3 でオーディオを圧縮しながら、ビデオとオーディオを結合し、対応する外部字幕ファイルを追加して作成する高品質圧縮ビデオ形式。画質は DVD に近く、容量は DVD の数分の 1 です。この種のエンコードはマシンに高い要件を必要としないため、DivX ビデオ エンコード テクノロジは、DVD キラーまたは DVD ターミネーターとして知られる、DVD にとって最大の脅威となる新しいビデオ圧縮形式であると言えます。

DivX は、DivX Corporation (旧 DivXNetworks Corporation) の有名なブランドである MPEG-4 テクノロジーのビデオ コーデック (コーデック) で、2007 年の秋にドイツの MainConcept を 2,200 万ドルで買収しました。

ISOは「超低ビットレートの動画・音声圧縮規格」を発表、MPEG-4を整理し、1998年10月に初版を承認、1994年4月に第2版とその検証モデル(VM)を発表、MPEG-4正式番号は ISO/IEC 国際標準 14496 です。これは新しいタイプのマルチメディア標準です。以前の標準との重要な違いは、オブジェクトベースのビジュアル コーディング圧縮標準であることです。定義されたレート コントロールの目標は、最高のレートを取得することです。特定のビット レートでの品質を維持できるため、インターネット上で高品質のマルチメディア ビデオを送信するための優れた技術プラットフォームが提供されます。

1998年微软开发了第一个在PC上使用的MPEG-4编码器,它包括MS MPEG4V1、MSMPEG4V2、MS MPEG4V3的系列编码内码,其中V1和V2用来制作AVI文件,一直到现在它都是作为Windows的默认组件,不过V1和V2的编码质量不是很好,一直到MS MPEG4V3才开始有好转,画质有了显着的进步,但是不知微软出于什么目的,却将这个MS MPEGV3的视频编码内核封闭,仅仅使其应用于Windows Media流媒体技术上,也就是我们熟悉的ASF流媒体文件中。ASF文件虽然有一些优势,但是由于过分的封闭不能被编辑,末得到广泛应用,这便惹怒了那些个不怕天不怕地的视频黑客和致力于钻研视频编码的高手,后来,这些小组不仅破解了微软的视频编码,而且经过他们的修改,一种新的视频编码诞生了:那就是 广为流传的MPEG编码器-DivX3.11。

DivX采用了MS的MPEGV3,改良后并加入自己功能称之为DivX3.11,也是目前互联网上普通采用的 MPEG-4编码器之一。很快,DivX被传得红得发紫,几乎成了业界的标准,但是,同样很快地出现了,DivX的基础技术是非法盗用微软的,微软声称将 对所有推动DivX发展的人、企业进行追究,可是DivX技术的创造者之一罗达(Rota)正全面申请将DivX合法化,这是基于DivX虽然是从 Window的发明出来的,但却没有用过任何微软的技术,更组建新公司DivXNetworks全力推广DivX,看来DivX(俗称压缩电影)蓬勃发展 的大潮是势不可挡了。

DivX の開発が順調に進んでいる間、DivX の技術が徐々に成熟し、ビジネス チャンスが無限に広がっていた頃、良いショーが見られました。 DivXNetworks の当初の目的は、Microsoft のクローズド テクノロジを排除することであったため、「Projet Mayo」という名前の完全なオープン ソース プロジェクトを立ち上げ、その目標は、オープン ソースの新しい MPEG4 エンコード ソフトウェア セットを開発することでした。 ISO MPEG規格であり、完全なオープンソースコードであるOpenDivXCODECには多くのソフトウェアやビデオの専門家が参加し、すぐにより高性能なエンコーダEncore2などを開発しましたDivXの最も輝かしい時代に、突然DXN社が現れました。 DivXのソースコードをクローズし、Encore2をベースにした自社製品DivX4をリリース DXNが自らバックドアを残したことが判明 DivXはGPL契約ではなくLGPL契約を採用 いずれもパブリックライセンス契約であるが、彼らはソフトウェアまたはソースコードの権利の自由な使用と変更を保証しますが、LGPLは私的所有権を許可しており、DXNはこの契約を利用して意表を突く大きな動きをしました。

その後、DXN によって叩きのめされた多くのソフトウェアおよびビデオ グループが独自のビジネスを開始し、徐々に開発力を再編成し、復讐の旗を高く掲げ、OpenDivX バージョンに基づいた新しい MPEG-4 エンコード、つまり XviD を開発しました。名前は DviX の正反対であり、名前だけで Xvid が復讐に満ちていることがわかります。

DivX は、過去 1 ~ 2 年でオンライン ビデオを主流にした画像圧縮コーディング規格です。当初は、Microsoft MPEG 4 ビデオコーディング標準に基づいて修正および開発され、無料でリリースされました。非常に優れた圧縮率が特徴で、DVD 品質の映画のセット全体を CD-R ディスクに圧縮して保存できます。現在、DivX は通常バージョンと Pro バージョンに分かれており、後者には有料バージョンと、再生用の DivX Player プログラムが付属する Adware (広告) バージョンの 2 種類もあります。ユーザーが無料の DivX コーデックをインストールすると、Windows Media Player で DivX ビデオを視聴することもできます。

注: 上記の資料は Wiki の照合に基づいています。

コーデック学習ノート (13): コンテナ (パート 1)
ビデオは、コンピュータのマルチメディア システムの重要な部分です。ビデオを保存するニーズを満たすために、ビデオとオーディオを 1 つのファイルにまとめて同時再生を容易にするために、さまざまなビデオ ファイル形式を設定することが行われています。ビデオ ファイルは実際には、さまざまなトラックがラップされたコンテナであり、使用されるコンテナの形式はビデオ ファイルのスケーラビリティに関係します。

FourCC の正式名は Four-Character Codes で、4 文字 (4 バイト) で構成されています。4 バイトの独立してマークされたビデオ データ ストリーム フォーマットです。これを説明するために、wav および avi ファイルに FourCC のセクションがあります。 AVI ファイル。エンコードに使用されるコーデックの種類。そのため、wavやaviには「IDP3」に相当するFourCCが多数存在します。

ISO/IEC

MPEG-PS・MPEG-TS・MPEG-4 Part 12 /JPEG 2000 Part 12・MPEG-4 Part 14

IT-T

H.222.0

その他

3GP および 3G2 · ASF · AVI · Bink · DivX メディア フォーマット · DPX · EVO · Flash ビデオ · GXF · M2TS · Matroska · MXF · Ogg · QuickTime ファイル フォーマット · RealMedia · REDCODE RAW · RIFF · Smacker · MOD および TOD · VOB ·ウェブM

音声のみ

AIFF・AU・WAV

3GP および 3G2 コンテナ

3GP (3GPP ファイル形式) は、3G UMTS マルチメディア サービス用に 3GPP (3rd Generation Partnership Project) によって定義されたマルチメディア コンテナです。3G 携帯電話で使用されますが、一部の 2G および 4G 携帯電話でも使用できます。3GP は ETSI 3GPP 技術仕様で定義されており、音声/オーディオ メディア タイプと時間情報を含むテキストを備えたビデオ ファイル形式で、IMS、MMS、マルチメディア ブロードキャスト/マルチキャスト サービス (MBMS)、およびエンドツーエンド パケットの送信に使用されます。スイッチド ストリーミング サービス (PSS)。

3G2 (3GPP2 ファイル形式) は、3G CDMA 2000 マルチメディア サービス用に 3GPP2 によって定義されたマルチメディア コンテナです。これは 3GP ファイル形式に非常に似ていますが、それに比べていくつかの拡張機能と制限があります。3G2 は 3GPP2 技術仕様で定義されています。

3GP と 3G2 ファイル形式はどちらも ISO/IEC 14496-12 (MPEG-4 Part 12) で定義されている ISO ベース メディア ファイル形式に基づいていますが、Boss の 3GP ファイル形式にはこれらのプロパティの一部がありません。3GP と 3G2 は MP4 (MPEG-4 Part 14) に似ており、これも MPEP-4 Part 12 に基づいています。3GP と 3G2 は、携帯電話のストレージと帯域幅の要件を軽減するように設計されています。これらは非常によく似た規格ですが、違い:

3GPP ファイル形式は GSM タイプの電話機に使用され、ファイル拡張子は .3gp
3GPP2 ファイル形式は CDMA タイプの電話機に使用され、ファイル拡張子は .3g2
  3GP ファイル ストレージ ビデオ ストリーム: MPEG-4 Part2、H.263、MPEG - 4 パート 10 (AVC/H.264)、オーディオ ストリーム AMR-NB、AMR-WB、AMR-WB+、AAC-LC、HE-AAC v1、および Enhanced aacPlus (HE-AAC v2)。3GPP では、ISO 基本ファイル形式 (MPEG-4Part12) での AMR および H.263 コーデックの使用が許可されています。これは、3GPP が ISO 基本ファイル形式でのサンプリング エントリとテンプレート フィールドの使用を規定しており、コーデック用の新しいボックスを定義できるためです。これらの拡張子は、登録機関によって ISO ベースのメディア ファイル形式 (「MP4 ファミリ」ファイル) のコードポイントとして登録されます。MPEG-4 メディアを 3GP ファイルに保存するために、3GP は MP4 および AVC ファイル形式仕様に参加することを規定しています。これらの仕様も ISO 基本メディア ファイル形式に基づいています。MP4 および AVC ファイル形式の仕様では、ISO ベースのメディア ファイル形式での MPEG-4 コンテンツの使用について説明します。一部の電話では、3GP ビデオの拡張子として .mp4 を使用します。

3G2 ファイル形式は、3GP ファイル形式と同じビデオ ストリームとオーディオ ストリームの一部を保存できます。さらに、3G2 は、EVRC、EVRC-B、EVRC-WB、13K (QCELP)、SMV、および VMR-WR を含むオーディオ ストリームを持つことができます。3G2 仕様では、3GPP のタイム ファイルを持つ特定の貨物ステーションも定義されています。3G2 ファイル形式は、Enhanced aacPlus (HE-AAC v2) および AMR-WB+ オーディオストリームをサポートしていません。3G2 ファイル内の MPEG-4 メディア (AAC オーディオ、MPEG-4 Part 2 オーディオ、MPEG-4 Part 10/H.264/AVC) の存在について、3G2 仕様では MP4 ファイル形式と AVC ファイル形式仕様について言及しています。ここで、これらを ISO ベースのメディア ファイル形式で使用する方法について説明します。H.263 および AMR コンテンツを 3G2 に保存する場合、3G2 仕様は 3GP ファイル形式仕様を参照します。

3GP 形式のビデオには 2 つの解像度があります。

解像度は 176×144 で、市販の 3GP フォーマットをサポートするすべての携帯電話に適しています。
解像度 320×240、クリア、ハイエンド携帯電話、MP4 プレーヤー、PSP、Apple iPod に適しています

ANIM 標準マルチメディア ファイルは、古典的な Commodore Amiga のデジタル アニメーションに使用されます。これは、オペレーティング システムで正式に採用された最初のアニメーション形式である IFF ILBM マスター仕様に従っています。

ASF

Microsoft WMA および WMV の標準コンテナー。

WMV(Windows Media Video)はマイクロソフト社が開発したデジタルビデオコーデック形式の総称であり、ASF(Advanced Systems Format)はそのカプセル化形式です。ASFでカプセル化されたWMVファイルには「デジタル著作権保護」の機能があります。拡張子:wmv/asf、wmvhd。

ASF (アドバンスト ストリーミング フォーマット Advanced Streaming Format)。ASF は、インターネット上のビデオ プログラムを直接視聴できる現在の Real Player に対抗するために MICROSOFT によって開発されたファイル圧縮形式です。ASF は MPEG4 の圧縮アルゴリズムを使用しており、圧縮率と画質が非常に優れています。ASF はインターネット上ですぐに視聴できるビデオ「ストリーム」形式で存在するため、画質が VCD より多少劣るのは当然のことですが、同じくビデオ「ストリーム」である RAM 形式よりは優れています。フォーマット。

ファイル拡張子: .asf .wma .wmv
インターネット メディアの種類: video/x-ms-asf、application/vnd.ms-asf
タイプ コード: 'ASF_'
固有のタイプ コード: 識別子 com.microsoft.advanced-systems-format
マジック ナンバー: 30 26 b2 75
開発者: Microsoft
形式の種類: コンテナ形式
コンテナストレージ: WMA、WMV、MPEG4 など
AVI

AVI (同じく RIFF に基づく、標準の Microsoft Windows コンテナ)。AVI は、英語の Audio Video Interleave (「オーディオ ビデオ インターリーブ」または「オーディオ ビデオ インターリーブ」と訳される) の頭字語で、Apple の Quicktime テクノロジに対抗するために Microsoft が 1992 年 11 月に発売したマルチメディア ファイル形式です。ここで言及する AVI は主にパッケージ化フォーマットを指します。

以前の AVI は Microsoft によって開発されました。その意味は Audio Video Interactive で、ビデオとオーディオのコードを一緒に保存することです。AVI は最も長く存続している形式でもあり、10 年以上前から存在しており、改訂版はリリースされていますが (V2.0 は 1996 年にリリースされました)、すでに古いものです。AVI 形式には多くの制限があり、ビデオ トラックとオーディオ トラックは 1 つずつしか存在できません (現在、オーディオ トラックを 2 つまで追加できる非標準プラグインがあります)。また、次のような追加トラックも存在できます。文章。AVI 形式には制御機能はありません。拡張子:avi.

AVI が使用できるコーデック:

ビデオ名 (このビデオの FourCC は括弧内に示されています)
o MPEG-1/-2 (MPEG/MPG1/MPG2)
o MPEG-4 (MP4V/XVID/DX50/DIVX/DIV5/3IVX/3IV2/RMP4)
o MS - MPEG4 (MPG4/MP42/MP43)
o WMV7/WMV8/WMV9 (WMV1/WMV2/WMV3)
o DV(DVSD/DVIS)
o Flash ビデオ (FLV1/FLV4)
o Motion JPEG (MJPG)
o LossLess JPEG (LJPG)
o H .264 (AVC1/DAVC/H264/X264)
o H.263 (H263/S263)
o H.261 (H261)
o Huffyuv (HFYU) o
AVIzlib (ZLIB) o
AVImszh (MSZH)
o Theora (THEO)
o Indeo Video (IV31/IV32)
o Cinepak (cvid)
o Microsoft Video 1 (CRAM)
o On2VP3 (VP30/VP31)
o On2VP4 (VP40)
o On2 VP6 (VP60/VP61/VP62)
o VC-1 (WVC1)
オーディオ
o PCM
o MP3 (0x0055)
o AC-3 (0x0092)
o AAC
  - HE-AAC
  - LC-AAC
o FLAC
o Indeo Audio
o TrueSpeech
o WMA
o Vorbis
  エンコードの組み合わせは、次の例に従って自由に選択できます。

(DivX または XviD+MP3).avi、
(H.264+MP3).avi
(WMV9+MP3).avi は
  、XviD+MP3 で構成される最も一般的な AVI です。

DVB-MS

DVR-MS (Microsoft Digital Video Recording、Microsoft Digital Video Recording) は、Windows XPMedia Center Edition、Windows Vista、および Windows 7 で録画された TV コンテンツを保存するために Microsoft が開発した専用のビデオおよびオーディオ ファイル コンテナ形式です。複数のデータ ストリーム (ビデオとオーディオ) は、DVR-MS 拡張機能を備えた ASF コンテナーにカプセル化されます。ビデオは MPEG-2 標準を使用してエンコードされ、オーディオは MPEG-1 Layer II または Dolby Digital AC-3 (ATSC A/52) を使用してエンコードされます。拡張フォーマットには、コンテンツおよびデジタル著作権管理のメタデータが含まれます。これらの形式のファイルは、Windows XP Service Pack 1 に含まれる DirectShow コンポーネントであるストリーム バッファ エンジン (SBE.dll) によって生成されます。

MPEG/MPG/DAT

MPEG格 式:MPEG(Moving Picture Experts Group),是一个国际标准组织(ISO)认可的媒体封装形式,受到大部份机器的支持。其存储方式多样,可以适应不同的应用环境。MPEG-4档的档容 器格式在Part 1(mux)、14(asp)、15(avc)等中规定。MPEG的控制功能丰富,可以有多个视频(即角度)、音轨、字幕(位图字幕)等等。MPEG的一个简化版本3GP还广泛的用于准3G手机上。扩展名:dat(用于VCD)、vob、mpg/mpeg、3gp/3g2(用于手机)等。

MPEG也是Motion Picture Experts Group 的缩写。这类格式包括了 MPEG-1, MPEG-2 和 MPEG-4在内的多种视频格式。MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在 VCD 的制作和一些视频片段下载的网络应用上面,大部分的 VCD 都是用 MPEG1 格式压缩的( 刻录软件自动将MPEG1转为 .DAT格式 ) ,使用 MPEG-1 的压缩算法,可以把一部 120 分钟长的电影压缩到 1.2 GB 左右大小。MPEG-2 则是应用在 DVD 的制作,同时在一些 HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用。使用MPEG-2 的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB 的大小(MPEG2的图像质量MPEG-1 与其无法比拟的)。

MPEG-PS:MPEG节目流(programstream),是MPEG-1和MPEG-2基准流的标准容器,用于在可靠介质上,例如磁盘,也用于DVD-Video光碟。

MPEG-TS:MPEG传输流,是数字广播和在非可靠媒体传输的标砖容器,也在蓝光光碟使用,通常携带多个视频和音频流以及一个电子节目指南。

n AVI

元の再生ソフトウェアが突然この形式の AVI ファイルを開けなくなった場合は、n AVI に遭遇したかどうかを検討する必要があります。n AVI は New AVI の略称で、Shadow Realm と呼ばれる地下組織によって開発された新しいビデオ形式です。これは、Microsoft ASF 圧縮アルゴリズム (想像上の AVI ではありません) の修正から派生したものであり、ビデオ フォーマットの追求は圧縮率と画質に他なりません。元の ASF フォーマットの欠点を補い、NAVI はより高いフレーム レートを実現できます。NAVIは、ビデオストリーミングの特性を取り除き、改良されたASF形式であると言えます。

注: 上記の資料は Wiki の照合に基づいています。

コーデック学習ノート (14): コンテナー (パート 2)
Matroska (MKV)

MKV はコーデックやシステム標準ではありませんが、実際にはあらゆるものをカプセル化できます。オープンかつオープンソースのコンテナ形式です。

拡張子 .mkv .mka .mksインターネット
メディア タイプ video/x-matroska audio/x-matroska 開発者
Matroska.org
形式 ビデオ ファイル形式マルチ
メディアに特化
フリー ファイル形式? はい: GNU LGPL

Matroska、多くの人はそれを MKV だと考えていますが、実際、MKV は Matroska メディア シリーズのファイルの 1 つにすぎません。Matroska は新しいマルチメディア パッケージ形式です。このパッケージ形式では、さまざまなコード化されたビデオ、さまざまな形式の 16 個以上のオーディオ、およびさまざまな言語の字幕を 1 つの Matroska メディア ファイルにパッケージ化できます。これは、オープンソースのマルチメディア パッケージ形式の 1 つでもあります。

MCF (マルチメディア コンテナ) と呼ばれるマルチメディア パッケージング フォーマットは、データを保存するためのオープン (ID 制限なし、無料) で自由なフォーマットです。開発者は、この形式とこの形式で開発されたソフトウェアを誰もが自由に使用できることを約束し、この形式が一般的になると商業研究プロジェクトにはならないと約束します。

Matroska Media では、次の 3 種類のファイルが定義されています。

MKV (Matroska Video File): オーディオと字幕を含めることができるビデオ ファイル、
MKA (Matroska Audio File): 複数のタイプのオーディオ トラックを含めることができる単一のオーディオ ファイル、
MKS (Matroska Subtitles): 字幕ファイル。
  これら 3 つのファイルの中で、MKV が最も一般的です。

Matroska の最大の特徴は、さまざまな種類のビデオ エンコーディング、オーディオ エンコーディング、字幕ストリームに対応できることです。また、非常に高密度の RealMedia および QuickTime ファイルにも対応し、オーディオとビデオを同時に再構成できることです。より優れたシャープな効果を実現します。

Matroska の開発は、多くの従来のメディア形式にとって大きな挑戦ですが、Matroska は多機能のマルチメディア コンテナとしても開発されています。

MP4

MP4 は、ISO 基本メディア ファイル形式 (MPEG-4 Part 12 および JPEG 2000 Part 12 で定義) に基づいて MPEG-4 で定義された標準オーディオおよびビデオ コンテナであり、MPEG-4 Part 14 で説明されています。これは、拡張子 .mp4 を持つ MPEG-4 を使用するマルチメディア コンピュータ ファイル形式で、主にデジタル オーディオとデジタル ビデオを保存するために使用されます。

拡張子 .mp4
インターネット メディア タイプ ビデオ/mp4、オーディオ/mp4、アプリケーション/mp4
タイプ コード mpg4
開発者 ISO
形式 ビデオ ファイル形式
オーディオ、ビデオ、テキスト専用
QuickTime .mov および MPEG-4 Part 12
標準 ISO/IEC 14496-から拡張14

モッド

MODフォーマットとは、ビクター製ハードディスクビデオカメラで採用されている記録フォーマットの名称です。

MOV

MOV は、評価会社の標準 QuickTime ビデオ コンテナです。QuickTime ムービーは、Apple Inc. によって開発されたコンテナです。プロフェッショナル グラフィックスの分野における Apple Computer の優位性により、QuickTime 形式は基本的に映画制作業界の一般的な形式となっています。1998 年 2 月 11 日、国際標準化機構 (ISO) は、QuickTime ファイル形式を MPEG-4 標準の基礎として認めました。QT は非常に多くのコンテンツを保存でき、ビデオやオーディオに加えて、画像、テキスト (テキスト字幕) などもサポートできます。拡張子: mov

Mac マシンを使用したことのある友人なら、QuickTime をある程度知っているはずです。QuickTime は、もともと Apple が Mac コンピュータで使用していた画像およびビデオ処理ソフトウェアでした。Quick-Time は、静的な PIC および JPG 画像形式、Indeo 圧縮方式に基づく動的 MOV、および MPEG 圧縮方式に基づく MPG ビデオ形式をサポートできる 2 つの標準画像およびデジタル ビデオ形式を提供します。

オッグ

Ogg は Xiph.org オーディオ コーデック Vorbis とビデオ コーデック Theora の標準ブリック コンテナであり、Ogg Media は完全にオープンなマルチメディア システム プロジェクトであり、OGM (Ogg Media File) はそのコンテナ フォーマットです。OGM は、ビデオ、オーディオ、字幕 (テキスト字幕) などの複数のトラックをサポートできます。拡張子:ogg.

遺伝子組み換え作物

Xiph.ofg のビデオ コーデック コンテナである OGM (Ogg Media) はサポートされなくなったため、その使用は推奨されません。

リアルメディア

RealMedia は、RealVideo および RealAudio の標準コンテナです。リアル ビデオまたはリアル メディア (RM) ファイルは、RealNetworks によって開発されたファイル コンテナです。通常、Real Video および Real Audio でエンコードされたメディアのみを収容できます。このファイルにはいくつかのインタラクティブな機能があり、スクリプトで再生を制御できるようになります。RM、特に可変ビット レート RMVB 形式は非常に小さいため、インターネット ダウンローダーに非常に人気があります。拡張子:rm/rmvb

RM

Real Networks が策定したオーディオ/ビデオ圧縮仕様 Real Media の 1 つで、Real Player でできることは、インターネット リソースを使用して、Real Media 技術仕様に準拠したオーディオ/ビデオをライブ ブロードキャストすることです。Real Media 仕様には主に、RealAudio、Real Video、Real Flash (Real Networks と Macromedia が共同で立ち上げた新世代の高圧縮アニメーション フォーマット) の 3 種類のファイルが含まれています。REAL VIDEO(RA、RAM)フォーマットは、当初からビデオストリーミングの応用分野に位置づけられており、ビデオストリーミング技術の創始者とも言えます。56K MODEM ダイヤルアップ インターネット アクセスを使用する条件では、途切れることのないビデオ再生を実現できますが、画質は VCD よりも劣るため、これらの RM 圧縮 DVD を見たことがあれば、明らかに比較できます。

RMVB

これは、RM ビデオ形式のアップグレードを拡張した新しいビデオ形式であり、RMVB ビデオ形式は、元の RM 形式の平均的な圧縮サンプリング方式を打ち破り、平均値を確保することに基づいてビット レートを合理的に使用することが高度な特徴です。リソース、つまり、静止したシーンや動きの少ないシーンでは、より低いエンコード レートが使用されるため、より多くの帯域幅スペースが残され、これらの帯域幅は、動きの速いシーンがあるときに利用されます。このように、静止画の画質を確保することを前提として、動画の画質が大幅に向上するため、画質とファイルサイズとの微妙なバランスがとられる。また、RMVB ビデオには、DVDrip 形式と比べて明らかな利点があり、約 700MB の DVD ムービーを、同じ音声とビジュアルの品質で RMVB 形式に書き写した場合、そのサイズは最大でも約 400MB になります。それだけでなく、このビデオ形式には、組み込みの字幕やプラグインのサポートが不要など、独自の利点もあります。このビデオ形式を再生する場合は、RealOne Player2.0 または RealPlayer8.0 と RealVideo9.0 以降を使用してデコーダを再生できます。

VOB

VOB ファイル (ビデオ オブジェクト) は、DVD ビデオ メディアのコンテナ形式です。VOB には、ビデオ、オーディオ、文字、メニューを 1 つのストリーム形式に統合して含めることができます。VOB は MPEG PS 形式に基づいていますが、プライベート ストリームに関する追加の制限と仕様があります。MPEG PS はプライベート ストリームと呼ばれる非標準データを提供します。VOB ファイルは、MEPG PS テーブルの非常に制限されたサブセットです。すべての VOB ファイルは MPEG PS ですが、すべての MPEG PS が VOB ファイルの定義に準拠しているわけではありません。

MPEG PS と同様に、VOB ファイルには H.262/MPEG-2 Part2 または MPEG-1 Part 2 ビデオ、MPEG-1 Audio LayerII または MOEG-2 Audio Layer II オーディオを含めることができますが、MPEG PS と比較すると、VOB ファイルにはでのこれらの圧縮形式の使用には特定の制限があります。さらに、VOB には文字だけでなくリニア PCM、AC-3、または DTS ビデオも含めることができます。VOB ファイルには、MPEG PS 標準で許可されている AAC オーディオ (MPEG-2 Part 7)、MPEG-4 圧縮形式などを含めることはできません。

ファイル拡張子.VOB
  開発者: DVD フォーラム
  タイプ: メディア コンテナ
  含まれるもの: オーディオ、ビデオ、アルファベット
  用途: DVD ビデオ
  どこに展開されるか: MPEG プログラム ストリーム、ISO/IEC 13818-1
  標準仕様: DVD ビデオ ブック

おすすめ

転載: blog.csdn.net/hmwz0001/article/details/130213080