理解视频格式(二)

二、视频的获取

        我们已经知道视频如何播放,那么这些视频是如何获得的呢?电影成像靠镜头把画面投影在胶片上而获得画面。视频画面的获得,和电影成像的方式相类似,只是画面投影在成像感应器上,感应器再把影像转换成画面信息。如图,就是摄像机摄取视频画面的方式。摄像机内三个感应器分别拍摄红、绿、蓝光的信息;如果是一个感应器的摄像机,那三种光都在一个感应器上完成摄取。感应器目前主要有CCD和CMOS两种,它们原理不同,但干的事情都一样。

① 摄像机
        我们前面已经知道电视机显像的原理,再去了解视频成像就很简单了。如图,摄像机把拍摄到的画面转换成红绿蓝信息,然后把红绿蓝信息传给电视机,电视机把它们投影在屏幕上,视频系统的工作就完成了。哈哈,很简单吧。这就是视频系统最核心的原理:把画面变成RGB,然后再把RGB还原成画面。视频系统的其他理论都是围绕着这个核心展开的,抓着这个核心,就能轻而易举地理解其他看似很复杂的视频原理。
      摄像机把拍摄的画面转换成RGB,然后把RGB传给电视机,电视机直接把RGB投影在屏幕上。看下图,摄像机把生成的独立的RGB信号直接给了电视机,我们把这3个独立的信号叫做分量(Component)。RGB信号就称作RGB分量。其实分量概念没什么高深的,就是独立信号的意思。

 现在我们可以说,视频系统的核心,就是完成RGB分量的传送。RGB分量的传输需要3条线,这种传输方式是最能真实还原画面(或者说最Hi-Fi)的方式。但RGB信号的传输需要很大的带宽,由于我们前面提到的电视网传输带宽的问题,在技术上和成本上传输RGB信号有一定难度。于是就发展出另外一些节约带宽的信号方式。

② 信号
       首先是所谓的“复合信号”(Composite)。就是把RGB三个分量给混起来,变成一个分量,这样1条线就搞定了。我们平时见得最多的就是这种信号接口,电视机的AV输入,DVD的AV输出都是这种信号。这种方式虽然简单,但它的画面质量并不高,家用是没有问题,但对于广播级别的要求就差很远了。因为它把RBG的信息都混在了一起,当还原的时候,清晰度和色彩都会发生很大的失真,所以,在要求比较高的视频制作中是不使用复合信号的。 

       看来要降低画面信息的失真,必须使用多分量的传输方式才行。于是出现了“Y/C分量系统”。Y就是亮度分量(Luminance),C就是色度分量(Color)。这种方式是将画面分解成亮度和色度两个信号(就像上面那个图中的两个电视屏幕那样)。亮度信号就是没有颜色的黑白画面,色度信号就是色彩的信息(但并不是完整的彩色画面),然后用2条线分别传送。这样,独立的亮度信号就可以降低画面图形的失真。我们常用的S端子(S-Video)就是Y/C分量系统。但是,Y/C方式依然把RGB的信息进行了混合,色彩方面肯定是要打折扣的。于是,又出现了另一种信号系统:YUV。 

               

         如图,YUV有三个分量,Y分量,U分量和V分量。Y是亮度分量;U和V是两个代表颜色的分量,它们分别代表红色减去亮度的差,和蓝色减去亮度的差;Y分量跟U和V分量可以经过“运算”转换还原出RGB分量。哇塞,头好大。如果我们用图像说明的话就是下图显示的那样,Y分量就是黑白图像,而U和V就是带有色彩信息的分量,RGB可以转换成YUV,YUV也可以转换成RGB。 

       YUV有2种标示方法:一种叫Y Pb Pr,另一种叫Y Cb Cr。Y Pb Pr是YUV在模拟系统的标示, Y Cb Cr是在数字系统的标示。虽然它们技术细节上有区别,但基本原理是一样的。 

       YUV分量也是3条线,并不比RGB分量少,为什么还多此一举搞什么运算转换,直接用RGB不就得了?对,如果直接用RGB当然比用YUV要好,然而,RGB所需的带宽空间比YUV要大很多。同时,YUV因为有一个黑白画面的Y分量,能很容易地兼容黑白电视,因此在兼容性上比RGB更好。于是,结合带宽上的优势,YUV就被应用在视频系统中。除了一些少数极其高端的影像制作会直接处理RGB外,到目前,YUV方式仍是广播电视系统最主要的传输和处理方式。通常在广电业内,如果提到分量信号如何如何,一般指的都是YUV分量。

      了解YUV分量是了解视频格式的基础,因为我们要处理的视频格式都是YUV信号,而不是RGB。

③ 成像
        前面我们讲到电视机有隔行和逐行的扫描方式,同样,在摄像机上也有这两种扫描方式。想像一下,摄像机的CCD就对应这电视机的屏幕。CCD上也是由像素组成,它经过扫描“记录”下每个像素上的RGB的例,然后传给电视机,电视机把这些 像素信息打在荧光屏上。
       摄像机的CCD像素的表示方法和电视机也是类似的,比如1280X720,960X540。画面经镜头投影在CCD的每个像素上,CCD通过扫描获得画面,隔行扫描就扫2次得1张,逐行就扫1次得1张。
       正因为隔行扫描的CCD是扫2次得1张图,导致它在拍摄运动画面时会出现“毛刺现象”。就像右图中的这个画面,当CCD扫完第1场的时候,这位仁兄已经不在原来那个地方了,CCD扫的第2场相当于一个已经“移位的”画面,于是两个场合成一个画面,就只这个样子。这是隔行扫描CCD拍摄画面的硬伤,如果要拍摄高质量的运动画面,逐行CCD才是不二选择。

                       

       CCD扫描线的扫描频率和密度并不一定是固定的,用术语说就是“采样率”(Sampling)并一定固定。所谓采样率,可以理解成扫描线和扫描线上“拾取”的数据点。看图就好说了,比如松下HVX200,它的CCD是960X540,这是CCD的物理像素,固定不变的。当它拍摄720P格式时,采样率是960X720,意思就是,扫描线在CCD上扫720条线,而在每条扫描线上“拾取”960个数据点。于是我们看到,物理像素有540排,而扫描线有720根,扫描线就比像素排列要密;而没条线上“拾取”数据的点有960个,和CCD像素相同,就像图上画的那样。


      而当HVX200以1080p方式拍摄时,采样率就变成1280X1080,即扫描线变得更密了,每条线上的采样点更多。使用不同的采样率,能够获得不同的画面像素,而不同的画面像素就产生了不同的视频格式。
由此我们知道,摄像机输出的视频格式的画面尺寸,是由CCD的物理像素和采样率共同决定的。CCD像素是一个物理指标,固定不变;而输出画面的像素则由不同的格式而决定。
      看得这里感觉如何?有点头大?别着急,慢慢往下看,看完后面的内容再回头去看前面的也许就容易明白了。当然,也可以休息一下,到阳台去呼吸一下新鲜空气,或者去洗把脸什么的。我们下面要有精彩内容了。 

转载于邓东的《理解视频格式》

发布了49 篇原创文章 · 获赞 138 · 访问量 30万+

猜你喜欢

转载自blog.csdn.net/lz0499/article/details/103338331