(音视频学习笔记):FFmpeg库简介、常用函数及数据结构解析

目录

FFmpeg库简介

FFmpeg函数简介

FFmpeg函数简介-封装格式相关

FFmpeg解码函数简介-解码器相关

FFmpeg 3.x 组件注册方式

FFmpeg 4.x 组件注册方式

Ffmpeg 4.0.2 组件注册方式

FFmpeg数据结构简介

FFmpeg数据结构之间的关系

AVFormatContext和AVInputFormat之间的关系

AVCodecContext和AVCodec之间的关系

FFmpeg数据结构之间的关系

FFmpeg数据结构分析

FFmpeg库简介

  • FFmpeg的整体结构

  • FFMPEG有8个常用库:
AVUtil 核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。
AVFormat 文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、 Muxer层,使得协议和格式对于开发者来说是透明的。
AVCodec 编解码库,封装了Codec层,但是有一些Codec是具备自己的License的, FFmpeg是不会默认添加像libx264、 FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。
AVFilter 音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。
AVDevice 输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。
SwrRessample 该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。
SWScale 该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280*720变为800*480。
PostProc 该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数。

FFmpeg函数简介

av_register_all() 注册所有组件,4.0已经弃用
avdevice_register_all() 对设备进行注册,比如V4L2等。
avformat_network_init(); 初始化网络库以及网络加密协议相关的库(比如openssl)

FFmpeg函数简介-封装格式相关

avformat_alloc_context() 负责申请一个AVFormatContext结构的内存,并进行简单初始化
avformat_free_context() 释放该结构里的所有东西以及该结构本身
avformat_close_input() 关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。
avformat_open_input() 打开输入音视频文件
avformat_find_stream_info() 获取音视频文件信息
av_read_frame() 读取音视频包
avformat_seek_file() 定位文件(可通过时间定位)
av_seek_frame() 定位文件(可通过文件大小定位)
  • 函数调用流程:

FFmpeg解码函数简介-解码器相关

avcodec_alloc_context3() 分配解码器上下文
avcodec_find_decoder() 根据ID查找解码器
avcodec_find_decoder_by_name() 根据解码器名字
avcodec_open2()  打开编解码器
avcodec_decode_video2() 解码一帧视频数据(不建议使用)
avcodec_decode_audio4() 解码一帧音频数据(不建议使用)
avcodec_send_packet() 发送编码数据包
avcodec_receive_frame() 接收解码后数据
avcodec_free_context() 释放解码器上下文,包含了avcodec_close()
avcodec_close() 关闭解码器
  • 函数调用流程:

  • 分析:

  • 其中name字段:

  • avcodec_find_decoder():
    • 查找注册的第一个H264解码器就退出来了。
  • avcodec_find_decoder_by_name():
    • 根据指定的名字查找,如果找不到指定名字,就是没有找到。
  • 如果上下文保存在解码器里面,多路解码的时候肯定有冲突。
    • 设计解码器要做到可重入,通过AVCodexContex保存解码后的上下文数据
  • AVCodexContex,avcosex_open2():让解码器和上下文做关联。

FFmpeg 3.x 组件注册方式

  • 使用ffmpeg,首先要执行av_register_all,把全局的解码器、编码器等结构体注册到全局的对象链表里,以便后面查找调用

FFmpeg 4.x 组件注册方式

  • FFmpeg内部去做,不需要用户调用API去注册。
  • 以codec编解码器为例:
    • 1. 在configure的时候生成要注册的组件
./configure:7203:print_enabled_components libavcodec/codec_list.c AVCodec codec_list $CODEC_LIST
  • 这里会生成一个codec_list.c 文件,里面只有static const AVCodec * const codec_list[]数组。
  • 2. 在libavcodec/allcodecs.c将static const AVCodec * const codec_list[]的编解码器用链表的方式组织起来

Ffmpeg 4.0.2 组件注册方式

  • FFmepg内部去做,不需要用户调用API去注册。
  • 对于demuxer/muxer(解复用器,也称容器)则对应
    • 1. libavformat/muxer_list.c
      • libavformat/demuxer_list.c 这两个文件也是在configure的时候生成,也就是说直接下载源码是没有这两个文件的。
    • 2. 在libavformat/allformats.c将demuxer_list[]和muexr_list[]以链表的方式组织。
  • 其他组件也是类似的方式

FFmpeg数据结构简介

AVFormatContext 封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息。

AVInputFormat demuxer

AVOutputFormat muxer

每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体。
AVStream 视频文件中每个视频(音频)流对应一个该结构体。
AVCodecContext 编解码器上下文结构体,保存了视频(音频)编解码相关信息。
AVCodec 每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体。
AVPacket 存储一帧压缩编码数据。
AVFrame 存储一帧解码后像素(采样)数据。

FFmpeg数据结构之间的关系

AVFormatContext和AVInputFormat之间的关系

  • AVFormatContext API调用
  • AVInputFormat 主要是FFMPEG内部调用
  • 数据
    • AVFormatContext 封装格式上下文结构体
    • struct AVInputFormat *iformat;
  • 方法:所有的方法可重入的
    • AVInputFormat 每种封装格式(例如FLV, MKV, MP4)
    • int (*read_header)(struct AVFormatContext *);
    • int (*read_packet)(struct AVFormatContext *, AVPacket *pkt);
int avformat_open_input(AVFormatContext **ps, const char *filename,
                        AVInputFormat *fmt, AVDictionary **options)

AVCodecContext和AVCodec之间的关系

  • 数据
    • AVCodecContext 编码器上下文结构体
    • struct AVCodec *codec;
  • 方法:
    • AVCodec 每种视频(音频) 编解码器
int (*decode)(AVCodecContext *, void *outdata, int *outdata_size, AVPacket *avpkt);
int (*encode2)(AVCodecContext *avctx, AVPacket *avpkt, const AVFrame *frame, int *got_packet_ptr);

FFmpeg数据结构之间的关系

  • AVFormatContext, AVStream和AVCodecContext之间的关系

  • 区分不同的码流(AVPacket 里面也有一个index的字段)
    • AVMEDIA_TYPE_VIDEO视频流
video_index = av_find_best_stream(ic, AVMEDIA_TYPE_VIDEO, -1,-1, NULL, 0)
  • AVMEDIA_TYPE_AUDIO音频流
audio_index = av_find_best_stream(ic, AVMEDIA_TYPE_AUDIO, -1,-1, NULL, 0)
  • AVPacket和AVFrame之间的关系

FFmpeg数据结构分析

  • AVFormatContext

iformat 输入媒体的AVInputFormat,比如指向AVInputFormatff_flv_demuxer
nb_streams 输入媒体的AVStream 个数
streams 输入媒体的AVStream []数组
duration 输入媒体的时长(以微秒为单位),计算方式可以参考av_dump_format()函数
bit_rate 输入媒体的码率
  • AVInputFormat
name 封装格式名称
extensions 封装格式的扩展名
id 封装格式ID
一些封装格式处理的接口函数 比如read_packet()
  • AVStream
index 标识该视频/音频流
time_base 该流的时基, PTS*time_base=真正的时间(秒)
avg_frame_rate 该流的帧率
duration 该视频/音频流长度
codecpar 编解码器参数属性
  • AVCodecParameters
codec_type 媒体类型,比如AVMEDIA_TYPE_VIDEO AVMEDIA_TYPE_AUDIO等
codec_id 编解码器类型, 比如AV_CODEC_ID_H264 AV_CODEC_ID_AAC
  • AVCodecContext
codec 编解码器的AVCodec,比如指向AVCodecff_aac_latm_decoder
width, height 图像的宽高(只针对视频)
pix_fmt 像素格式(只针对视频)
sample_rate 采样率(只针对音频)
channels 声道数(只针对音频)
sample_fmt 采样格式(只针对音频)
  • AVCodec
name 编解码器名称
type 编解码器类型
id 编解码器ID
一些编解码的接口函数 比如int (*decode)()
  • AVPacket
pts 显示时间戳
dts 解码时间戳
data 压缩编码数据
size 压缩编码数据大小
pos 数据的偏移地址
stream_index 所属的AVStream
  • AVFrame
data 解码后的图像像素数据(音频采样数据)
linesize 对视频来说是图像中一行像素的大小;对音频来说是整个音频帧的大小
width, height 图像的宽高(只针对视频)
key_frame 是否为关键帧(只针对视频) 
pict_type 帧类型(只针对视频) 。例如I, P, B
sample_rate 音频采样率(只针对音频)
nb_samples 音频每通道采样数(只针对音频)
pts 显示时间戳

猜你喜欢

转载自blog.csdn.net/baidu_41388533/article/details/112728029