ffmpeg学習(対応するファイル情報の出力、音声ファイル情報の抽出)

目次

対応するファイル情報を出力します

音声ファイル情報を抽出する


対応するファイル情報を出力します

# 概念
マルチメディア ファイルはコンテナであり、コンテナ内には (ストリームまたはトラック) で表される多数のストリームが存在します。異なるストリームはそれぞれ交差せず、異なるエンコーダによってエンコードされます (オーディオとビデオの異なるエンコードも同様です)。ストリームから読み取られるデータは 1 つ以上の圧縮データ フレームを含むパケットです。

```
AVFormatContext: マルチメディア ファイル ストリーム コンテキスト
AVstream: マルチメディア ストリーム、マルチメディア ファイルからストリームを読み取る
AVPacket: マルチメディア ストリーム圧縮のフレーム レートを取得します
```
FFmpeg がストリーム データを操作するための基本手順:

 **1. 逆多重化
 2. データ フロー
 3. データ パケットの取得
 4. 関連リソースの解放**
# マルチメディア ストリーム情報の印刷

```cpp
extern "C"
{
    #include <libavutil/log.h>
    #include <libavformat/avformat.h>
}
#ifdef av_err2str
#undef av_err2str
#include <string>
av_always_inline std::string av_err2string(int errnum) {
    char str[AV_ERROR_MAX_STRING_SIZE];
    return av_make_error_string(str, AV_ERROR_MAX_STRING_SIZE, errnum);
}
#define av_err2str(err) av_err2string(err).c_str()
#endif


int main(int argc, char const *argv[])
{   int ret;
    av_log_set_level(   AV_LOG_INFO);
    // 注册信息
    av_register_all();
    AVFormatContext *fmt_ctx=NULL;
    // 打开多媒体文件,制定多媒体文件内容上向文,制定文件地质,指定文件类型,制定传入参数
    ret=avformat_open_input(&fmt_ctx,argv[1],NULL,NULL);
    if(ret<0){
        av_log(NULL,AV_LOG_INFO,"CAN'T OPEN FILE:%s \n",av_err2str(ret));
        return -1;
    }
    // av_dump_format()参数为上下文信息,流的索引值,多媒体文件名,输入流0或者输出流信息
    // 打印媒体流信息
    av_dump_format(fmt_ctx,0,argv[1],0);
    // 带开多媒体文件
    avformat_close_input(&fmt_ctx);
    return 0;
}


----------------------------------------输出情報------ ------------------------------------
入力#0、mov、mp4、m4a、3gp、3g2、 mj2、「../source/big_buck_bunny_720p_30mb.mp4」から:
  メタデータ:
    メジャーブランド: isom
    マイナーバージョン: 512
    互換性ブランド: isomiso2avc1mp41
    作成時間: 1970-01-01T00:00:00.000000Z
    エンコーダー: Lavf53.24.2
  持続時間: 00: 02:50.86、ビットレート: N/A
  ストリーム #0:0(und): ビデオ: h264 (avc1 / 0x31637661)、なし、1280x720、1086 kb/s、25 fps、25 tbr、12800 tbn (デフォルト) メタデータ: Creation_time
    :
      1970-01 -01T00:00:00.000000Z
      ハンドラー名 : VideoHandler
      ベンダー ID : [0][0][0][0]
  ストリーム #0:1(und): オーディオ: aac (mp4a / 0x6134706D)、48000 Hz、6 チャンネル、383 kb/s (デフォルト) メタデータ: Creation_time : 1970-01-01T00:00:
    00.000000Z
      handler_name
      : SoundHandler
      Vendor_id : [0][0][0][0]
「」

音声ファイル情報を抽出する

# マルチメディア ファイル内のオーディオ データを抽出します。
 1. av_init_packet(): パケット構造を初期化します。
 2. av_find_best_stream: マルチメディア ファイルから最適なデータ ストリームを取得します。 3.
 av_read_frame()/av_packet_unref(): ストリーム内のパケットを読み取ります。使用後のスペースを増やす

**ACC 形式でカプセル化されるため、カプセル化プロセス中にADTS 形式で保存する必要があります。ADIS と比較して、 ADTS 形式はストリーミングでの使用が容易であり、そのサイズは 7 バイトです**
![ここに画像の説明を挿入します](https://img-blog.csdnimg.cn/df7cd41e337949d99a96777a5ad8fb31.png)

 - syncword (合計 12 ビットを占める): 同期ヘッダーは ADTS フレームの始まりを表し、すべてのビットは 1、つまり 0xFFF に設定されます。 - ID (1 ビット): MPEG 識別子、0 は MPEG-4 を示し   
 、 1 は MPEG-2
 - Layer (2 桁): 00 に直接設定
 - protection_absent (1 桁): エラーをチェックするかどうかを示します。1 CRC なし、0 CRC プロファイルあり: AAC エンコード レベル、0:
 - メイン プロファイル (2 ビット): 1: LC (最も一般的に使用される)、2: SSR、3: 予約済み
 -sampling_frequency_index (サンプリング周波数識別子): サンプリング レートMark Private bit: 直接 0 に設定、デコード時にこのパラメータを無視
 - channel_configuration (3 ビット): チャネル番号識別、ライフ レイアウト構造
 -original_copy (1 ビット): 直接 0 に設定、デコード時にこのパラメータを無視
 - home (1 ビット) ): 直接 0 に設定され、デコード時にこのパラメータを無視します。

**変数ヘッダー情報: adts_variable_header()**
    ![ここに画像の説明を挿入](https://img-blog.csdnimg.cn/53ec80a625ce43b4beed02289c7a73fa.png)

 - copyright_identification_bit: 直接 0 に設定され、デコード時にこのパラメータを無視します。
 - copyright_identification_start: 直接 0 に設定され、デコード時にこのパラメータを無視します。
 - aac_frame_lengtht: 現在のオーディオ フレームのバイト数、エンコードされたメタデータのバイト数 + ファイルの数ヘッダー バイト (0 = = protection_absent ? 7: 9)
 - adts_buffer_fullness: 0x7FF に設定すると、可変ビット レートを意味します
 -number_of_raw_data_blocks_in_frames: 現在のオーディオ パケットに含まれるオーディオ エンコード フレームの数。aac_nums - 1 に設定します。オーディオのフレームが 1 つしかない場合は 0 に設定されます。

```cpp
extern "C"
{
   #include <stdio.h>
    #include <libavutil/log.h>
    #include <libavformat/avio.h>
    #include <libavformat/avformat.h> 
}

#define ADTS_HEADER_LEN  7;

static int get_audio_obj_type(int aactype){
    //AAC HE V2 = AAC LC + SBR + PS
    //AAV HE = AAC LC + SBR
    //所以无论是 AAC_HEv2 还是 AAC_HE 都是 AAC_LC
    switch(aactype){
        case 0:
        case 2:
        case 3:
            return aactype+1;
        case 1:
        case 4:
        case 28:
            return 2;
        default:
            return 2;

    }
}

static int get_sample_rate_index(int freq, int aactype){

    int i = 0;
    int freq_arr[13] = {
        96000, 88200, 64000, 48000, 44100, 32000,
        24000, 22050, 16000, 12000, 11025, 8000, 7350
    };

    //如果是 AAC HEv2 或 AAC HE, 则频率减半
    if(aactype == 28 || aactype == 4){
        freq /= 2; 
    }

    for(i=0; i< 13; i++){
        if(freq == freq_arr[i]){
            return i;
        }
    }
    return 4;//默认是44100
}

static int get_channel_config(int channels, int aactype){
    //如果是 AAC HEv2 通道数减半
    if(aactype == 28){
        return (channels / 2); 
    }
    return channels;
}

static void adts_header(char *szAdtsHeader, int dataLen, int aactype, int frequency, int channels){

    int audio_object_type = get_audio_obj_type(aactype);
    int sampling_frequency_index = get_sample_rate_index(frequency, aactype);
    int channel_config = get_channel_config(channels, aactype);

    printf("aot=%d, freq_index=%d, channel=%d\n", audio_object_type, sampling_frequency_index, channel_config);

    int adtsLen = dataLen + 7;

    szAdtsHeader[0] = 0xff;         //syncword:0xfff                          高8bits
    szAdtsHeader[1] = 0xf0;         //syncword:0xfff                          低4bits
    szAdtsHeader[1] |= (0 << 3);    //MPEG Version:0 for MPEG-4,1 for MPEG-2  1bit
    szAdtsHeader[1] |= (0 << 1);    //Layer:0                                 2bits 
    szAdtsHeader[1] |= 1;           //protection absent:1                     1bit

    szAdtsHeader[2] = (audio_object_type - 1)<<6;            //profile:audio_object_type - 1                      2bits
    szAdtsHeader[2] |= (sampling_frequency_index & 0x0f)<<2; //sampling frequency index:sampling_frequency_index  4bits 
    szAdtsHeader[2] |= (0 << 1);                             //private bit:0                                      1bit
    szAdtsHeader[2] |= (channel_config & 0x04)>>2;           //channel configuration:channel_config               高1bit

    szAdtsHeader[3] = (channel_config & 0x03)<<6;     //channel configuration:channel_config      低2bits
    szAdtsHeader[3] |= (0 << 5);                      //original:0                               1bit
    szAdtsHeader[3] |= (0 << 4);                      //home:0                                   1bit
    szAdtsHeader[3] |= (0 << 3);                      //copyright id bit:0                       1bit  
    szAdtsHeader[3] |= (0 << 2);                      //copyright id start:0                     1bit
    szAdtsHeader[3] |= ((adtsLen & 0x1800) >> 11);           //frame length:value   高2bits

    szAdtsHeader[4] = (uint8_t)((adtsLen & 0x7f8) >> 3);     //frame length:value    中间8bits
    szAdtsHeader[5] = (uint8_t)((adtsLen & 0x7) << 5);       //frame length:value    低3bits
    szAdtsHeader[5] |= 0x1f;                                 //buffer fullness:0x7ff 高5bits
    szAdtsHeader[6] = 0xfc;
}

int main(int argc, char *argv[])
{
    int err_code;
    char errors[1024];

    char *src_filename = NULL;
    char *dst_filename = NULL;

    FILE *dst_fd = NULL;

    int audio_stream_index = -1;
    int len;

    AVFormatContext *ofmt_ctx = NULL;
    AVOutputFormat *output_fmt = NULL;

    AVStream *out_stream = NULL;

    AVFormatContext *fmt_ctx = NULL;
    AVFrame *frame = NULL;
    AVPacket pkt;

    av_log_set_level(AV_LOG_DEBUG);

    if(argc < 3){
        av_log(NULL, AV_LOG_DEBUG, "the count of parameters should be more than three!\n");
        return -1;
    }

    src_filename = argv[1];
    dst_filename = argv[2];

    if(src_filename == NULL || dst_filename == NULL){
        av_log(NULL, AV_LOG_DEBUG, "src or dts file is null, plz check them!\n");
        return -1;
    }

    dst_fd = fopen(dst_filename, "wb");
    if (!dst_fd) {
        av_log(NULL, AV_LOG_DEBUG, "Could not open destination file %s\n", dst_filename);
        return -1;
    }

    /*open input media file, and allocate format context*/
    if((err_code = avformat_open_input(&fmt_ctx, src_filename, NULL, NULL)) < 0){
        av_strerror(err_code, errors, 1024);
        av_log(NULL, AV_LOG_DEBUG, "Could not open source file: %s, %d(%s)\n",
               src_filename,
               err_code,
               errors);
        return -1;
    }

    /*retrieve audio stream*/
    if((err_code = avformat_find_stream_info(fmt_ctx, NULL)) < 0) {
        av_strerror(err_code, errors, 1024);
        av_log(NULL, AV_LOG_DEBUG, "failed to find stream information: %s, %d(%s)\n",
               src_filename,
               err_code,
               errors);
        return -1;
    }

    /*dump input information*/
    av_dump_format(fmt_ctx, 0, src_filename, 0);

    frame = av_frame_alloc();
    if(!frame){
        av_log(NULL, AV_LOG_DEBUG, "Could not allocate frame\n");
        return AVERROR(ENOMEM);
    }

    /*initialize packet*/
    av_init_packet(&pkt);
    pkt.data = NULL;
    pkt.size = 0;

    /*find best audio stream*/
    audio_stream_index = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0);
    if(audio_stream_index < 0){
        av_log(NULL, AV_LOG_DEBUG, "Could not find %s stream in input file %s\n",
               av_get_media_type_string(AVMEDIA_TYPE_AUDIO),
               src_filename);
        return AVERROR(EINVAL);
    }

    /*
     #define FF_PROFILE_AAC_MAIN 0
     #define FF_PROFILE_AAC_LOW  1
     #define FF_PROFILE_AAC_SSR  2
     #define FF_PROFILE_AAC_LTP  3
     #define FF_PROFILE_AAC_HE   4
     #define FF_PROFILE_AAC_HE_V2 28
     #define FF_PROFILE_AAC_LD   22
     #define FF_PROFILE_AAC_ELD  38
     #define FF_PROFILE_MPEG2_AAC_LOW 128
     #define FF_PROFILE_MPEG2_AAC_HE  131
    */

    int aac_type = fmt_ctx->streams[1]->codecpar->profile;
    int channels = fmt_ctx->streams[1]->codecpar->channels;
    int sample_rate= fmt_ctx->streams[1]->codecpar->sample_rate;

    if(fmt_ctx->streams[1]->codecpar->codec_id != AV_CODEC_ID_AAC){
        av_log(NULL, AV_LOG_ERROR, "the audio type is not AAC!\n");
        goto __ERROR;
    }else{
        av_log(NULL, AV_LOG_INFO, "the audio type is AAC!\n"); 
    }

    /*read frames from media file*/
    while(av_read_frame(fmt_ctx, &pkt) >=0 ){
        if(pkt.stream_index == audio_stream_index){

            
            char adts_header_buf[7];
            adts_header(adts_header_buf, pkt.size, aac_type, sample_rate, channels);
            fwrite(adts_header_buf, 1, 7, dst_fd);

            len = fwrite( pkt.data, 1, pkt.size, dst_fd);
            if(len != pkt.size){
                av_log(NULL, AV_LOG_DEBUG, "warning, length of writed data isn't equal pkt.size(%d, %d)\n",
                       len,
                       pkt.size);
            }
        }
        av_packet_unref(&pkt);
    }

__ERROR:
    /*close input media file*/
    avformat_close_input(&fmt_ctx);
    if(dst_fd) {
        fclose(dst_fd);
    }

    return 0;
}


「」
 

おすすめ

転載: blog.csdn.net/qq_44632658/article/details/131741341