多媒体技术(大计基复习资料)

多媒体信息特点:

  1. 数据量大
  2. 连续性
  3. 数据编码方式多样

多媒体关键技术:

  1. 多媒体同步技术(研究视频数据和声音数据在时间上的协调)
  2. 多媒体压缩技术
  3. 大容量存储技术
  4. 多媒体编码技术
  5. ……

图像数字化过程:

  1. 采样:分辨率M✖️N
  2. 量化(二位1色(二值图)/灰度8位(灰度图)/真彩色24位(彩色图))

      量化位数(像素深度):存储每个像素所使用的二进制的位数  

  1. 编码 

图像类型:

  1. 分为三类:数字图像(位图)、矢量图、红外图像
  2. 矢量图与位图的区别:矢量图占用的存储空间小,保存的是描述图形的指令(位图保存的是像素颜色信息),不受分辨率的影响(不失真),但显示速度慢
  3. 红外图像特点:有较大的作用距离和较强的抗干扰能力,夜间可以保持工作,但像素分辨率低,边缘模糊、温度区间界限不明显,文件格式特殊、不通用

常见图像文件格式:

  1. GIF格式:最多只有256种颜色
  2. PNG格式:背景可以是透明或者半透明的
  3. JPEG格式:有损压缩格式
  4. BMP格式:通常不压缩,体积大
  5. TIFF格式:在各种地理信息系统、遥感领域广泛应用

各种颜色模型:

  1. RGB颜色:
      1. 三种基本颜色等量相加为白色;红绿等量相加而蓝色为0为黄色;红蓝等量相加而绿色为0时为品红色;绿蓝等量相加红为0为青色
      2. R、G、B各占用8bit
  2. HSL颜色模型:

三个基本要素:色调、饱和度、亮度

  1. CMKY颜色模型

常用于印刷行业的颜色空间

  1. YUV颜色模型

Photoshop 8.0.1不支持

声音编码三步骤:

  1. 采样:将声音信号在时间上离散化

   采样频率越高,声音质量越好

  1. 量化:将声音信号在幅度上离散化,将某个范围内的振幅用一个确定的值来表示

      均匀量化意味着所有输入信号采用统一量化间隔,量化位数越高,声音质量越好

  1. 编码:采样点落在两个相邻幅度之间时,按就近原则选择采样点幅度等级;若恰好落在相邻幅度之间,则取高等级

声音分析:

  1. 时域分析:

步骤:语音分帧、定量分析(语音信号具有典型的时域特征,短时能量、短时平均能量、短时平均过零率等)

意义:实现语音的分割、分类

  1. 频域分析(傅立叶变换):

       概念:从频率域上提取信息的频率特性

       意义:分析信号的频率构成、发现主要成分

  1. 语谱图:将时域、频域特征共同呈现,横轴表示时间、纵轴表示频率,每个点的灰度值大小反映相应时刻和相应频率的能量,点越高表示能量越高

计算题!!!

  1. 一幅分辨率为1065✖️1065的真彩色图像所占用的存储空间:

  (1065✖️1065✖️3B)/(1024✖️1024)=3.22MB

这里要注意换算单位

  1. 声频比特率(bps)=采样率(Hz)✖️量化位数(bit)✖️声道数

音频文件大小(Byte)=比特率(bps)✖️时长(s)/8

  1. 视频流码率(bps)=帧率(fps)✖️分辨率✖️量化位数(bit)

视频文件总码率=视频流码率+音频流码率

视频文件大小(Byte)=码率(bps)✖️视频时长(s)/8

常见语音编码技术:

  1. WAV格式:保存没有压缩的音频,即使用PCM编码的音频,也称为波形文件
  2. CDA格式(CD):只包含了音频数据的索引信息,无法直接在计算机中播放,与WAV格式的声音文件质量相同
  3. MP3格式:音频压缩技术,音质有较小损失,牺牲了文件中12KHz~16KHz高频部分质量
  4. MID格式:存储声音的指令

数字视频的优点:

   抗干扰能力强、可以不失真的进行多次复制和长距离传输、使用视频编辑软件进行编辑处理和合成(可进行非线性编辑)、可以长时间存储、易于实现资源共享

几个琐碎的知识点:

  1. 影响图像质量的因素:

图像分辨率、量化位数、像素深度

  1. 影响声音质量的因素:

采样频率、量化位数、声道数

数据编码:

  1. 游程长度编码(无损压缩)

   采用“相同的像素点个数(设为a)+相同的像素的像素值(设为b)”的方式记录图像信息

   图像中色块区域越大,数据的相关性越强,则压缩比越大

   灰度图一个游程长度2个字节(a+b),真彩图一个游程长度4个字节(数字不变,色彩变为3个字节,相加可得),灰度图原来的编码长度直接为长乘宽,真彩图原来的长度为长乘宽乘3(每个像素对应3个字节)

  1. 哈夫曼编码(无损压缩)

   出现越多的字符分配越少的编码,是得最终的平均码长最短

   编码不唯一、译码唯一(唯一前缀)

   符号出现次数越不平均,压缩效果越好

   可变字长编码

   树中大的那边是0

   压缩后字符串编码长度为次数乘编码长度的加和,而原来未压缩时乘2

人工智能:

  1. 发展:
  1. 弱人工智能:擅长于单个方面
  2. 强人工智能:在各方面与人类比肩
  3. 超人工智能:几乎所有方面都比人类聪明
  1. 关于学习的分类
  1. 机器学习
  2. 深度学习:特征提取、训练、识别
  3. 强化学习

自主探索磁性套索、魔棒、自由套索、椭圆选框、色阶工具、仿制图章

Ps中按住alt拖动图层实现复制、按住control实现拖动

压缩比为原始:压缩后的

Supongo que te gusta

Origin blog.csdn.net/dream_lxk/article/details/122278424
Recomendado
Clasificación