2024年5月29日发(作者:)

1.视频压缩

①视频为什么要压缩?——因为我们的存储空间有限。

一张VGA格式的全彩图片,分辨率为640*480,从电脑的角度看(电脑是离散数字系统),

即为640*480个像素点;

再者,全彩图片的每个像素点由RGB三种颜色组成,每种颜色的数值0~255中的任一个,

也就是8bits=1Byte,那么640*480*3Bytes就是这张静态VGA图片所占用的存储空间(未

压缩)。对于视频来说,我们假设24fps(1秒由24张这样的静态图片构成),再用码率

(单位时间s内视频的bits)来表示体积,那么一段24fps的未压缩视频码率为:

640*480*3*8*24=176Mbps。

显然,这不是一个大部分用户能接受的体积。

②什么是压缩?——空域下大体分为无损和有损两种,时域下为参考前后帧(x264的B、P

帧等)

无损压缩:基于将重复信息只保留一遍,常见的无损压缩算法称为熵编码。

有损压缩:主要是量化(在视频处理中,特指通过用较小的2进制数来表示某一个较大的2

进制位数的数)

变换域编码:绝大多数图像的低频分量占据着最主要的部分,因此高频分量的舍弃能节省

许多储存空间,在H264标准中,采取的是整数变换。

高频分量一般代表物体的锐利边缘,而低频分量真是构成一幅图像的最主要部分。

2.电脑中的多媒体编解码器

其实就是理解电脑中多媒体文件播放的过程。

Encoder:编码器是将源文件用该种编码器的算法编译一遍所用的工具。

Decoder:解码器就是将视频文件解码成视觉能接收的数据(图像)的工具。

Splitter:分离器就是将视频源文件和音频源文件分离并从容器中取出送入相应解码器的

工具。

以上三者完成了电脑中视频播放的整个流程。(实际其实还要经过显卡和声卡的处理才能

最终为人所接收)

3.工业标准正方形像素 —— Industry standar square-pixel

其实它的意思是:1:1采集。

举个不恰当的例子:给个640象素长的线条让你把他1:1对应着同样用640象素再画出来。

不过还是难以理解,这个概念其实是个很抽象的东西,下面我会继续反反复复把这个概念

尽量好好分析下。

1

目前的NTSC制式电视是隔行扫描的。NTSC电视讯号水平扫描线总共525条。扫描一行

的时间是63.5556 us(1秒/{525行*29.97FPS}=63.5556微秒)。其中大约有52微秒可利

用。其它时间是用来同步以及等待扫描线归位(电子束从右边移到左边)。在采集中如果

要维持1:1的取样密度比(1:1采集或者说方型象素采集), 就需要在52.1482us内扫描出

640点。因此采样频率必须是(12 + 27/99)MHz。(在视讯规格中, 业界square pixel的

标准是SMPTE 244M。SMPTE 244M规定的取样时间是52.1482us(52.1482us x取样频率 =

640)。52.1482us*(12 + 27/99)MHz=640.36=640。因此,取样频率被定为

(12 + 27/99)MHz。Industry standard square-pixel的规定采样频率)

D1, DBTC, DVD, DVB等媒体遵循的却是ITU-R BT.601, ITU-R BT.601规定以13.5MHz

为取样频率。因此ITU-R BT.601在同样长的时间内可以把640采集成13.5MHz * 52.1482us

= 704.0007。(换个角度来看[其实还是采样频率做怪]13.5/(12+27/99)=1.1=11:10 。

X/640=11/10?于是X=704。所谓的11:10就是来自这里。)

另外:ITU-R BT.601规定的取样时间是53.3333us。比SMPTE 244M标准的52.1482us

长。结果53.3333 x 13.5 = 719.99955=720。于是所谓的720就出来了(其实就等于多扫

描了16个象素)。也顺便解决了:数字讯源规格之所以定为720左右留下一段空间, 可以

避免取样取样画面可能会往左或往右偏时,讯号超出反折。多观察就可以发现, 有许多影

片有效画面并不是在正中央。(取样密度相同, 取出来的范围变大。但左右两缘不见得会

有讯号, 通常会出现黑边。SMPTE RP 187建议将第2与第716点定为画面左右两缘。 在理

想情况下, ITU-R BT.601取样出来的有效画面 (扣除黑边) 应该是714x480。 不过一般都

随便搞, 704已经算不错了, 低于700的也不少。)

~人已去,勿念~……[2001:da8:8006:226:886c:7f02:15b3:b360]:10086

TV/DVD制式

2