多媒体技术（大计基复习资料）

多媒体信息特点：

数据量大
连续性
数据编码方式多样

多媒体关键技术：

多媒体同步技术（研究视频数据和声音数据在时间上的协调）
多媒体压缩技术
大容量存储技术
多媒体编码技术
……

图像数字化过程：

采样：分辨率M✖️N
量化（二位1色（二值图）/灰度8位（灰度图）/真彩色24位（彩色图））

量化位数（像素深度）：存储每个像素所使用的二进制的位数

编码

图像类型：

分为三类：数字图像（位图）、矢量图、红外图像
矢量图与位图的区别：矢量图占用的存储空间小，保存的是描述图形的指令（位图保存的是像素颜色信息），不受分辨率的影响（不失真），但显示速度慢
红外图像特点：有较大的作用距离和较强的抗干扰能力，夜间可以保持工作，但像素分辨率低，边缘模糊、温度区间界限不明显，文件格式特殊、不通用

常见图像文件格式：

GIF格式：最多只有256种颜色
PNG格式：背景可以是透明或者半透明的
JPEG格式：有损压缩格式
BMP格式：通常不压缩，体积大
TIFF格式：在各种地理信息系统、遥感领域广泛应用

各种颜色模型：

RGB颜色：
1. 1. 三种基本颜色等量相加为白色；红绿等量相加而蓝色为0为黄色；红蓝等量相加而绿色为0时为品红色；绿蓝等量相加红为0为青色
  2. R、G、B各占用8bit
HSL颜色模型：

三个基本要素：色调、饱和度、亮度

CMKY颜色模型

常用于印刷行业的颜色空间

YUV颜色模型

Photoshop 8.0.1不支持

声音编码三步骤：

采样：将声音信号在时间上离散化

采样频率越高，声音质量越好

量化：将声音信号在幅度上离散化，将某个范围内的振幅用一个确定的值来表示

均匀量化意味着所有输入信号采用统一量化间隔，量化位数越高，声音质量越好

编码：采样点落在两个相邻幅度之间时，按就近原则选择采样点幅度等级；若恰好落在相邻幅度之间，则取高等级

声音分析：

时域分析：

步骤：语音分帧、定量分析（语音信号具有典型的时域特征，短时能量、短时平均能量、短时平均过零率等）

意义：实现语音的分割、分类

频域分析（傅立叶变换）：

概念：从频率域上提取信息的频率特性

意义：分析信号的频率构成、发现主要成分

语谱图：将时域、频域特征共同呈现，横轴表示时间、纵轴表示频率，每个点的灰度值大小反映相应时刻和相应频率的能量，点越高表示能量越高

计算题！！！

一幅分辨率为1065✖️1065的真彩色图像所占用的存储空间：

（1065✖️1065✖️3B）/（1024✖️1024）=3.22MB

这里要注意换算单位

声频比特率（bps）=采样率（Hz）✖️量化位数（bit）✖️声道数

音频文件大小（Byte）=比特率（bps）✖️时长（s）/8

视频流码率（bps）=帧率（fps）✖️分辨率✖️量化位数（bit）

视频文件总码率=视频流码率+音频流码率

视频文件大小（Byte）=码率（bps）✖️视频时长（s）/8

常见语音编码技术：

WAV格式：保存没有压缩的音频，即使用PCM编码的音频，也称为波形文件
CDA格式（CD）：只包含了音频数据的索引信息，无法直接在计算机中播放，与WAV格式的声音文件质量相同
MP3格式：音频压缩技术，音质有较小损失，牺牲了文件中12KHz～16KHz高频部分质量
MID格式：存储声音的指令

数字视频的优点：

抗干扰能力强、可以不失真的进行多次复制和长距离传输、使用视频编辑软件进行编辑处理和合成（可进行非线性编辑）、可以长时间存储、易于实现资源共享

几个琐碎的知识点：

影响图像质量的因素：

图像分辨率、量化位数、像素深度

影响声音质量的因素：

采样频率、量化位数、声道数

数据编码：

游程长度编码（无损压缩）

采用“相同的像素点个数（设为a）+相同的像素的像素值（设为b）”的方式记录图像信息

图像中色块区域越大，数据的相关性越强，则压缩比越大

灰度图一个游程长度2个字节（a+b），真彩图一个游程长度4个字节（数字不变，色彩变为3个字节，相加可得），灰度图原来的编码长度直接为长乘宽，真彩图原来的长度为长乘宽乘3（每个像素对应3个字节）

哈夫曼编码（无损压缩）

出现越多的字符分配越少的编码，是得最终的平均码长最短

编码不唯一、译码唯一（唯一前缀）

符号出现次数越不平均，压缩效果越好

可变字长编码

树中大的那边是0

压缩后字符串编码长度为次数乘编码长度的加和，而原来未压缩时乘2

人工智能：

发展：

弱人工智能：擅长于单个方面
强人工智能：在各方面与人类比肩
超人工智能：几乎所有方面都比人类聪明

关于学习的分类

机器学习
深度学习：特征提取、训练、识别
强化学习

自主探索磁性套索、魔棒、自由套索、椭圆选框、色阶工具、仿制图章

Ps中按住alt拖动图层实现复制、按住control实现拖动

压缩比为原始：压缩后的

多媒体技术（大计基复习资料）

Supongo que te gusta