视音频学习笔记(一)

音视频基础知识-常用名词概念列表:

  • 1.视频播放参数

    视频码率 kb/s
    视频帧率 fps
    视频分辨率

  • 2.I P B帧

    I帧:独立成像,GOP的基础帧一组只有一个I帧,可指定出现频率
    P帧:根据前帧来解码
    B帧:前后参考所得

  • 3.压缩算法

    MPEG2
    H264
    H265
    AVS

  • 4.音频

    波形,模拟转数字
    采样频率:44100
    采样深度:16bit
    单双通道
    4分钟采样大小:44100 * 16 * 2 * 4 * 60 = 338688000bit/8/1024/1024 = 40M

  • 5.音频概念扩展

    采样频率:每秒钟采样点的个数
    22000 (22kHz):无线广播
    44100 (44kHz):CD音质
    48000 (48kHz):数字电视,DVD
    96000 (96kHz) :蓝光,高清

    扫描二维码关注公众号,回复: 11361446 查看本文章

    采样精度:每个样本点的大小,8bit 16bit 24bit

    通道数:单声道、双声道、四声道、5.1声道

    搜索:变声不变调算法

    音频的帧:其实音频没有帧的概念,
    这里假定,每帧持续时间 = 每帧采样数 / 采样频率
    交错模式:左右声道样本交互记录
    非交错模式:先记录一个周期内所有左声道样本

  • 6.视音频的封装格式

    也叫容器:将以编码压缩好的视频流、音频流、字幕流按照一定的方案放到一个文件中,便于播放软件播放
    常见容器格式有:MP4, FLV, RMVB, AVI, MPEG

  • 7.音视频同步
    这里有很多实现,以后讨论

  • 8.视音频相关常见的开源项目
    ffmpeg, ijkplayer, QMPlay2
    后面详细讨论介绍FFmpeg

下面是一些视频编码相关的概念:

  • 9.视频编码标准

    ITU-T ISO
    H.265/HEVC

  • 10.编码形式类别

    基于波形的编码:MPEG-1, MPEG-2, H.264, H.265

    基于内容的编码:MPEG-4

  • 11.信源编码器概念

    帧内编码/帧间编码
    帧间编码/运动估计
    帧内编码
    环路滤波器

  • H.264架构

    每一帧被分为一个或多个条带(slice)进行编码;每一个条带包含多个宏块
    宏块是H.264基本的编码单元,包含一个16×16亮度块 + 两个8×8色度块 + 其他一些宏块头 信息;

    H.264编解码器:JM ,X264

    H.264码流结构:NAL单元,NAL Unit 格式

  • 熵编码

    哈夫曼编码:
    建立哈夫曼二叉树,构造码表

    H.264中的熵编码:指数哥伦布编码

    编码算法:CAVLC,CABAC

    封装格式与编码格式:H261,块结构混合编码

  • 常用视音频分析工具
    文件总体信息:MediaInfo
    封装格式信息:Elecard Format Analyzer
    H.264码流分析信息:Elecard Stream Eye
    YUV视频像素数据:YUV Player
    PCM音频采样数据:Audition

猜你喜欢

转载自blog.csdn.net/alspd_zhangpan/article/details/106948641