博客栏目停服公告
因网站改版更新,从9月1日零时起美国中文网将不再保留博客栏目,请各位博主自行做好备份,由此带来的不便我们深感歉意,同时欢迎 广大网友入驻新平台!
美国中文网
2024.8.8
||
文科尤其艺术类本科生必须知晓的数字电视原理
(不用高等数学和大学物理表达的数字时代电视编辑基础知识)
杨新磊
1、模拟电视
(1)模拟电视,Analog television,就是信号的摄制、传输、接收的整个过程都是在模拟体制下完成的技术系统与标准,如模拟摄像机、模拟发射机、模拟电视机等。
(2)特点:采用时间轴取样,每帧在垂直方向取样,以幅度调制方式传送电视图像信号。为降低频带,同时避开人眼对图像重现的敏感频率,将1帧图像又分成奇、偶两场扫描。
(3)缺点:易受干扰、色度畸变、亮色串扰、行串扰、行蠕动、大面积闪烁、清晰度低和临场感弱等缺点。在模拟领域,无论怎样更新,无论怎样改进硬件结构,电视所应有的功能和声像质量还远没有达到,不足以使其全面地发生根本性的变革。20世纪80年代,德国首先出现了数字电视接收机,从而揭开了数字电视的帷幕。
2、数字电视
(1)数字电视,Digital television,就是信号的摄制、传输、接收的整个过程都是基于数字技术体制下完成的电视系统与标准,如数字摄像机、数字发射机、数字电视机等。所有的信号传播,都是通过由0、1数字串所构成的数字流来实现。数字电视是计算机技术成熟后的产物。俗称“数码电视”。
(2)优点:
1)信号处理与传输的质量决定于信源。
因为数字设备只输出1和0两个电平,恢复时不究大小,因而信号稳定,抗干扰强,非常适合远距离的数字传输。数字信号在多次处理和传输中进入杂波后,其杂波幅度不超过某额定电平,可以通过数字再生清除;即使引入的杂波幅度超过了额定值,造成了误码,也可以引入信道的纠错编码技术,在接受端纠正过来。所以数字传输不会降低信噪比,避免了系统非线形失真的影响,大大提高了图像的质量。换言之,在相同的覆盖面积下,数字电视大大节省了发射功率。模拟信号在传输过程中噪声逐步积累,而数字信号在传输过程中基本不产生新的噪声,信噪比基本不变。
2)易于实现信号的存储,而存储时间与信号的特性无关。
大规模集成电路技术发展迅速,使半导体存储器可以存储多帧电视信号,从而完成用模拟技术不可能达到的处理功能。
3)数字电视采用数据压缩技术,便于实现Internet、电视网、电信网走向融合,构成一类多媒体通信系统,成为未来国家信息基础设施的重要组成部分。三网走向融合是大势所趋,也是充分实现真正意义上的信息资源共享,避免重复建设的关键所在。
4)数字技术可以实现时分多路,充分利用信道容量,利用数字电视信号中的行、场消隐时间,实现文字多工广播(容易实现数字变换,为图、文、声、数据并茂的综合业务数字网开拓了广阔的应用领域)。
5)压缩后的数字电视信号经数字调制后,可进行多种形式的高质量广播。其服务区的观众将以极大概率实现“无差错接受”,收看到的电视声像质量非常接近演播室质量。数字电视还可实现高质量的移动接受。
6)具有开放性和兼容性。通过机顶盒或电缆调制解调器可以实现模拟接收和回传信号,改变了模拟体制下NTSC、PAL、SECAM制电视节目不能交换的特性。
7)可以合理地利用各种类型的频谱资源。以地面广播为例,数字电视可以启用模拟电视的“禁用频道”,而且在今后能够采用“单频率网络(SFN)”技术,例如1套电视节目仅占用同1个数字电视频道而覆盖全国。
8)在同步转移模式(STM)的通信网络中,可实现多种业务的“动态组合”。例如,在数字高清晰度电视节目中,经常会出现图像细节较少的时刻,这时由于压缩后的图像数据量较少,可插入其他业务(如电视节目指南、传真、电子游戏软件等),而不必插入大量没有意义的“填充比特”。
9)很容易实现密码措施,即加密/解密和加/干扰,便于专业应用(包括军用)以及数据广播业务的应用。特别是开展各类条件接收的收费业务,这是数字电视的重要增值点,也是数字电视得以快速滚动式发展的基础。
10)具有可扩展性、可分极性和互操作性,便于在各类通信信道特别是异步转移模式(ATM)的网络中传播,也便于与计算机网络联通。
11)改变人们接受电视的方式。如交互电视的产生为电视的应用开辟了新天地。交互电视/视频点播使人们在收看高清晰电视的同时,可以享受到“电视导演或电视编辑”的乐趣,可以足不出户地收看高清晰电影(当然是付费的)。
12)数字电视的出现还将极大地改变信息家电的市场结构。目前,模拟电视机除了产业结构不合理以外,重要的还是因其相对技术含量不高,导致在飞速发展的电子产品市场竞争中处于不利地位。而数字电视能够促进电视机扩大画面、提高分辨率及展宽屏面,并以全新型电视机的姿态提高销售价格。
(3)核心技术
1)数字电视的核心技术,体现于制作、发射和接收三个环节。数字电视制作技术,主要体现在数字摄像机、数字照相机、数字编辑机、非线性编辑系统、数字特效系统、数字字幕机。数字信号发射技术,主要体现在数字信号处理技术(DSP)、压缩与解压、地面广播传输、有线电视(或光缆)传输、卫星广播(DSS)及宽带综合业务网(ISDN)等;数字电视接收技术,体现在阴极射线管显示器(CRT)、液晶显示器、等离子体显示器、投影仪等。
2)编码标准
国际上对数字图像编码曾制订了三种标准,主要用于电视会议的H.261,主要用于静止图像的JPMG标准,主要用于连续图像的MPEG标准。MPEG(Moving Picture Expert Group)意思是“运动图像专家组”,压缩后的信息可以供计算机处理,也可以在现有和将来的电视广播频道中进行分配。MPEG是一个不断更新的动态标准,迄今已经开发出从MPEG-1到MPEG-9的完整序列。美国、欧洲、日本都采用了MPEG标准。
在音频编码方面,欧洲、日本采用了MPEG-2标准。但是,美国采纳了杜比公司(Dolby)的AC-3方案,MPEG-2为备用方案。
中国来说,今后逐渐也会与美国、欧洲、日本一样,采用标准。
3、高清与标清
高清,英文为High Definition,缩写为HD,意思是“高分辨率、高清晰度”。高清电视,High Definition Television,缩写为HDTV。高清与高清电视,HD与HDTV,基本上是同义语,其本质为一种国际通用的数字电视技术格式与标准。
HD或HDTV,是由The Society of Motion Picture and Television Engineers(SMPTE,美国电影电视工程师协会)确定的高清晰度电视标准格式。SMPTE是一个半官方的探讨电视技术的国际组织,基本可代表美国国家标准。
电视的清晰度是以扫描线计算的。电视的扫描有隔行扫描和逐行扫描两种方式。隔行扫描,即interlace,常用i代称。隔行扫描就是每一帧被分割为两场,每一场包含了一帧中所有的奇数扫描行或者偶数扫描行,通常是先扫描奇数行得到第一场,然后扫描偶数行得到第二场。由于视觉暂留效应,人眼将会看到平滑的运动,而不是闪动的半帧半帧的图像。但是,这时会有几乎不会被注意到的闪烁出现,使得人眼容易疲劳。当屏幕的内容是横条纹时,这种闪烁特别容易被注意到。每一帧图像由电子束顺序地一行接着一行连续扫描而成,就是逐行扫描,即scan per line,简写为P。逐行扫描克服了隔行扫描的缺点,画面平滑自然无闪烁。比如,NTSC制节目共525行扫描线,每秒60场图像,表示为60i或525i;如果是逐行扫描的,就称作60P或525P。PAL制节目为625行,每秒50场图像,表示为50i或625i,逐行则称为50P或625P。
SONY生产的HDW-F900R是一款24P多格式摄录一体机,这里的24P或25P,就是24 frame per second或25frame per second的缩写,与扫描无关。因此,这是一种适用于数字电影的高清前期设备,像素可达1080i,合称1080i 24p 或1080i 25p。
数字电视几种常见的电视扫描格式:
1)D1为480i格式,与NTSC制模式电视相同,525条垂直扫描线,480条可见垂直扫描线,4:3 或16:9,隔行/60Hz,行频为15.25KHz。
2)D2为480P格式,和逐行扫描DVD规格相同,525条垂直扫描线,480条可见垂直扫描线,4:3 或 16:9,分辨率为640×480,逐行/60Hz,行频为31.5KHz。
3)D3为1080i格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080,隔行/60Hz,行频为33.75KHz。
4)D4为 720p格式,是标准数字电视显示模式,750条垂直扫描线,720条可见垂直扫描线,16:9,分辨率为1280×720,逐行/60Hz,行频为45KHz。
5)D5为1080p格式,是标准数字电视显示模式,1125条垂直扫描线,1080条可见垂直扫描线,16:9,分辨率为1920×1080逐行扫描,专业格式。
6)此外,还有576i,是标准的PAL电视显示模式,625条垂直扫描线,576条可见垂直扫描线,4:3或16:9,隔行/50Hz,记为576i或625i。
高清,HD,就是指支持1080i、720P和1080P的电视标准。从视觉效果来看,HD的规格最高,其图像质量可达到或接近35mm宽银幕电影的水平,它要求视频内容和显示设备水平分辨率达到1000线以上,分辨率最高可达1920×1080。从画质来看,由于高清的分辨率基本上相当于传统模拟电视的4倍,画面清晰度、色彩还原度都要远胜过传统电视,而16:9的宽屏显示也带来更宽广的视觉享受。从音频效果看,高清电视节目将支持杜比5.1声道环绕声,这将给我们带来超震撼的听觉享受。
标清,英文为“Standard Definition”,缩写为SD。标清电视,英文为“Standard Definition Television”,缩写为 SDTV。二者基本上是同义语。标清,就是只能支持分辨率在720p以下的电视标准。比如,专业级摄录设备,分辨率在400线左右的VCD、DVD。
4、高清时代的电视机
电视接收机,俗称“电视机”,是接收环节的电视设备,主要在家庭使用。电视制作进入高清时代后,电视机也相应发生了深刻变革。
电视机,根据不同的分类标准,可分为很多类型。如果根据电视机荧屏的形状,可划分为鼓面电视电视机和平板电视机。平板电视和平板电视机是同义词。
平板电视机,Flat Panel Display,FPD,顾名思义,就是屏幕呈平面的电视,它是相对于突鼓、庞大、笨重的传统电视机而言的电视机,是数字时代的电视机,主要为呈现和播放高清、标清电视节目。
平板电视机,根据显示器原理的不同,可分为液晶电视机、等离子电视机、背投电视机等类型。
液晶电视机就是显示器为液晶的电视机。液晶,Liquid Crystal Display,LCD,是一种介于固态和液态之间的物质,是具有规则性分子排列的有机化合物。如果把它加热会呈现透明状的液体状态,把它冷却则会出现结晶颗粒的混浊固体状态,故名“液晶”。液晶电视机的显示屏,是在两张玻璃之间的液晶内,加入电压,通过分子排列变化及曲折变化,再现画面,屏幕通过电子群的冲撞,制造画面并通过外部光线的透视反射来形成画面。
等离子电视机就是显示器采用等离子技术的电视机。等离子,Plasma Display Panel,PDP,是利用两块玻璃基板之间的惰性气体电子放电,产生紫外线激发所涂布的红、绿、蓝荧光粉,呈现各种彩色光点的画面。
等离子电视机和液晶电视机的区别在于――等离子是气体成像,液晶是液态的晶体成像。成像原理的不同,造成了两者在对比度和清晰度上有细微的差距。
背投电视机,是一种假借投影和反射原理,将屏幕和投影系统置于一体的电视显像系统。在投影显示设备中,按其投影方式投影显示分为正投影和背投影两种方式。正投影最直接的应用就是投影机,是指光线投射到屏幕正面显像。而背投影之原理,简单来说,是将投影机安装在机身内的底部,信号经过反射,投射到半透明的屏幕背面显像,背投电视机就是这种原理的产物。由于投影机和屏幕的合为一体,背投电视机的用户无须对系统进行光学调整,使得其使用方便性大大超过了正面投影机。背投电视机的真正价值在于采用液晶显示屏,成为液晶背投电视机,这是集合了两项新技术的最先进的电视机。
平板电视机的特点为大屏幕,超薄,超轻,清晰度高、音质佳,是数字时代的主流与趋势。
机顶盒,set top box,就是置于电视接收机顶上的盒子,可将接收下来的数字信号转换为模拟信号,以便模拟电视机显示。用户不必更换电视机,就可看到数字电视节目。但是,最多为标清。机顶盒是从模拟到数字过度阶段的权宜之计。
5、DV
DV是英语Digital Video的缩写,指的是家用级数字视频技术与标准。
DV,1993年,由索尼(SONY)、松下(PANASONIC)、JVC(胜利)、夏普(SHARP)、东芝(TOSHIBA)和佳能(CANON)等多家著名家电巨擘联合制定的一种数码视频格式。然而,在绝大多数场合,DV则是代表数码摄像机。
和模拟摄像机相比,DV有如下突出的特点:
1)清晰度高。我们知道,模拟摄像机清晰度不高,如VHS的水平清晰度为240线,最好的Hi8也只有400线。而DV记录的则是数字信号,其水平清晰度已经达到了500~540线,可以和专业摄像机相媲美。
2)色彩更加纯正。DV的色度和亮度信号带宽差不多是模拟摄像机的6倍,而色度和亮度带宽是决定影像质量的最重要因素之一,因而DV拍摄的影像的色彩就更加纯正和绚丽,也达到了专业摄像机的水平。
3)无损复制。DV磁带上记录的信号可以无数次地转录,影像质量丝毫也不会下降,这一点也是模拟摄像机所望尘莫及的。
4)体积小重量轻。和模拟摄像机相比,DV机的体积大为减小,一般只有123mm×87mm×66mm左右,重量则大为减轻,一般只有500克左右,极大地方便了用户体积只有74.7mm×61.9mm×26.9mm,重量才90克,比大多数手机还要轻些。
5)DV可以与计算机连接,以读取DV带中的内容,继而对这些内容进行后期处理,如编辑等,还可以刻成VCD或DVD保存起来。DV还可以与电视机连接,不仅能在电视机上读取DV带中的内容,还能录制电视节目。
现今随着高清晰度视频DV的不断涌现,DV的存储介质容量也成了一个最为大家所关心的话题所以乎一夜间市面上突然冒出很多的DV,这些DV之间最大的不同可能就是采用的存储介质不同,虽然容量有大小之分,但是优缺点也有相互存在,那么下面就让笔者给大家来简单分析下。采用硬盘作为存储介质的JVC摄像机
现在市场上的DV,按照存储介质大约可以分为硬盘类、光盘类、DV带类、存储卡类这四大类。
1)硬盘DV。市面上的硬盘DV以JVC品牌DV为主,主流容量为20-60GB。硬盘DV的优势就在于存储空间大,可以很方便的将录制的节目存储到电脑中,或者直接利用配套的DVD刻录设备将碟片刻出。
2)光盘介质DV产品,是最金贵的一类产品,但也是最方便的一类机器。光盘介质的DV采用了DVD光盘作为存储介质,当结束拍摄的时候,只需要将DVD直接取出就可以在任何一台DVD播放器上进行播放。
3)DV带介质,优点就是价格便宜,随处可以买到,而缺点就是磁带保存的时间短,而且拍摄的视频导出电脑时速度慢,非常不爽。
4)存储卡介质的DV产品,一般集中在使用价廉物美的SD卡上。此类机器的体积最为小巧,携带最为方便,缺点就是比较费电,待机时间短,镜头性能一般。
6、数字时代的电影与数字电影
电影,已有一百多年的历史。电影,在数字时代,也产生了深刻的变革,数字电影应运而生。数字电影,诞生于20世纪80年代,是高科技的产物。数字电影,指以数字技术和设备摄制、存储,并通过卫星、光纤、磁盘、光盘等物理媒体传送,将数字信号还原成符合电影技术标准的影音,放映在银幕上的电影技术与电影作品。从制作工艺、制作方式到发行及传播方式上,数字电影均全面数字化。
数字电影的优势主要体现在:(1)降低、节约了电影制作费用,革新了制作方式,提高了制作水准;(2)通过高清摄像技术,实现了与高清时代的接轨,推动了电影与电视的融合;(3)数字介质存储,永远保持质量稳定,不会出现任何磨损、老化等现象,更不会出现抖动和闪烁;(4)传送、发行不需要洗映胶片,发行成本大大降低,传输过程中不会出现质量损失;(5)而如果使用了卫星同步技术,还可附加如直播重大文体活动、远程教育培训等等,这一点是胶片电影所无法企及的;(6)实现了计算机与电影的深度结合。数字电影进入到了微观世界,它将图像分解为最小的单元――像素,然后再重新组合,以改变或者重建某一部分的影像和情景,创造出一般摄影方法根本达不到的扣人心弦的镜头,在创作上几乎达到随心所欲的境地。数字电影营造出极度的虚拟空间和各种匪夷所思的景象,这些都是普通电影制作手段无法展示的。这种结合,集中体现在电影特效和动画电影两个方面;(7)数字电影能演绎全新DOBLY 5.1声道、AC-3、DTS音响环绕的声音效果,极大地扩展了电影声音的表现空间,使电影声音的感染力、震撼力达到了前所未有的水平;(8)数字电影为电影衍生品的开发,尤其游戏产品、网络产品等,提供了飞速发展的空间。
数字电影极大地拓宽了艺术家的创作天地,给正在衰落的电影产业注入了新的活力,一代具有新思维的艺术创作人员和电影产业中的新兴职业,如数字电影软件设计师、电脑美术设计师、视觉效果设计师等会在21世纪的电影舞台上成为主角。
数字电影加速了电视电影的前进步伐。
电视电影,Movie made for television或telefilm,起源于20世纪60年代的美国,是由电视人投资的低成本电影,适合在电视上播出。传统的电视电影,用35毫米胶片拍摄制作。许多著名的电影作品,如基耶斯洛夫斯基的《十诫》、希区柯克的《精神病患者》、美国恐怖片《X档案》、侦破片《神探亨特》等,其实都是电视电影。同样,不少著名的导演、演员也是靠拍电视电影起家的,如斯皮尔伯格。
电视电影,电视电影应该比一般的电视剧更精美的制作,影像应更清晰,这是一个技术手段和材料介质问题。专门为电视电影创作的剧本既要区别于电影的题材,又要有电影剧本那样严谨的结构和独特的电影语言及较高品位的内涵,有比电视剧更深化的主题。电视电影是当前市场经济条件下对电影艺术文本的一种补缺,其低成本运作的投资风险性也是传统电影所无法比拟的最大优势之一。电视电影因其低成本、表达自如、传播渠道便捷、受众广大而为越来越多有才华的影视创作者所关注。
数字时代的电视电影,完全抛弃了胶片,在技术上和数字电影已无二致。
7、清晰度
(1)、人眼的“视觉锐度”
人眼对所观察的实物细节或图像细节的辨别能力,具体量化起来,就是能分辨出平面上的两个点的能力。人眼的分辨力是有限的,在一定距离、一定对比度和一定亮度的条件下,人眼只能区分出小到一定程度的点,如果点更小,就无法看清了。人眼分辨图像细节的能力称为“视觉锐度”。这就决定了影视工作者力求达到的影像清晰度的指标,也决定了采用图像像素的合理值。
视觉锐度的大小,可以用能观察清楚的两个点的视角来表示,这个最小分辨视角称为“视敏角”。视敏角越大,能鉴别的图像细节越粗糙;视敏角越小,能鉴别的图像细节越细致。在中等亮度和中等对比度的条件下,观察静止图像时,对正常视力的人来说,其视敏角在1~1.5分之间;观察运动图像时,视敏角更大一些。
为了将研究的对象从两个点扩大到一个面,所以,将视敏角从人眼到两个点之间的夹角,引伸到从观察点(人眼)到一定距离的一条相邻黑、线条之间的夹角。如果观察的是在垂直方向上排列的一系列连续水平黑白线条,则能表现出图像的垂直清晰度;如果观察的是在水平方向排列的一系列连续垂直黑白线条,则能表现出图像的水平清晰度。
(2)电视清晰度的由来
电视正是利用了这个原理,确定出了电视应当设计成具有多高的垂直清晰度和多高的水平清晰度,再从清晰度推算出需要多少条水平扫描线和多少条垂直扫描线,从扫描线又推导出需要多少水平像素和多少垂直像素,也即建立起了相应的图像的分辨率和单幅电视图像的扫描格式,将它再与每秒钟图像的显示次数和其它指标结合起来,最终建立起了相应的电视制式。
试验表明,观看图像的最佳距离应当是画面高度的4倍至5倍,这时的总视角约为15度,在这种情况下,可以保证人眼不转动就能看到完整的画面。这个距离,既可以避免因过近观看时眼球需要不停地转动而引起眼疲劳,又可以避免过远观看时对图像辨别能力的降低,以及防止画面以外的景像进入视野中。在5倍画面高度的距离观看图像时,人眼的垂直分辨力是约458线,这时图像所具有的垂直清晰度正是458线。这样,在制定电视制式的扫描格式时,其垂直像素应当基于458线清晰度来考虑。
水平清晰度的确定,与确定垂直清晰度的思路是一样的。传统电视屏幕的宽高比是4:3,这是根据早期电影银幕的长宽比预先确定下来的。试验说明,水平清晰度和垂直清晰度应当接近或一样,才能获得最佳的图像质量。利用这两点,再根据垂直清晰度计算原理,将垂直清晰度线数乘以屏幕幅型比4/3,立即可以算出图像的水平清晰度线数为458×4/3=610(线)。这就是说,在5倍画面高度距离观看4:3画面的图像时,人眼的水平分辨力约为610线,这时图像所具有的水平清晰度正是610线。
“水平的”英文为horizontal,“垂直的”英文为vertical,所以,记为610h 458v。
不难看出,电视的清晰度(Definition)是指电视机已经显示出来的黑白相间的直线,在垂直方向或水平方向将屏幕排满时,人眼所能辨别的最细线条数,或者说能辨别的最多线条数。在垂直方向排列的这种水平线条的最大数量,是电视的垂直清晰度(vertical definition);在水平方向排列的这种垂直线条的最大数量,是电视的水平清晰度(horizontal definition)。
(3)清晰度与分辨率的区别
电视的清晰度,是在确定电视图像的扫描线数和像素数之前就提出来的一个重要概念和物理量。分辨率(Resolution)指图象中存储的信息量。电视图像的分辨率以每英寸的像素数来衡量,像素越多,分辨率越高。分辨率与清晰度完全不是一个概念。
不论是对摄像机还是电视接收机来说也好,分辨率都是固定不变的,而清晰度却是可变的。虽然分辨率的高低对清晰度有影响,但分辨率并不是人们看到的图像清晰度。图像信号分辨率是源头,最终显示的图像清晰度是结果;从数量上来说,清晰度永远小于分辨率。同一分辨率的图像信号,通过不同的传输渠道和不同的显示设备,最终得到的图像清晰度是各不相同的。因此,分辨率与清晰度之间并没有直接换算关系,没有可比性。
1080p或1080i的HDTV,清晰度为1920h 1080v。
8、数字时代的声音
(1)DOLBY
DOLBY,中译“杜比”,是英国R.M.DOLBY博士的名字,他在美国设立的杜比实验室,先后发明了杜比降噪系统、杜比环绕声系统等多项技术,对电影音响和家庭音响产生了巨大的影响。
杜比降噪系统主要用来降低录音或放音的噪声,在1970年代就已经广泛地用于家用录音机中。
杜比环绕声系统,则是美国杜比实验室为改善立体声质量而研制成功的影院音响系统。在立体声电影院中,为了给观众创造出身临其境的空间感觉,除左右声道外,还装了能强化银幕上声音效果的中置声道和能使观众获得环境气氛与特殊效果感觉的环绕声道。这一环绕声道用了许多扬声器,沿两侧墙面和后墙并联架设。杜比环绕声系统在1970年代末拍摄的《星球大战》中,成功地实现了声音方向与画面移动的同步,让观众感受到声音从头顶呼啸而过的方位感和现场感,引起了电影界的震动,因此这一系统后来在电影院中获得了极为广泛的应用。
由于多声道直接录制和传输即昂贵又不方便,1976年,杜比实验室发明了杜比立体声电影系统,把左、中、右、环绕四个声道的信息经降噪后按一定方式编制记录成两声道。在播放时再按相反的方式还原成四个声道(即4-2-4方式),从而实现了多声道与二声道的兼容传输。
随着数字技术的日益成熟,为了满足下一代电视广播的要求,在杜比定向逻辑环绕声的基础上,1994年,杜比实验室与日本先锋公司发布了他们合作研制开发的一种全新的数字化多通道影视音响系统:Audio Coding-3,取其字头命名为AC-3。1997年,又更名为杜比数码:DOLBY DIGITAL。它既可装备到电影院去,又可配置到家庭影院中来。
杜比AC-3是一个压缩/解压缩系统。它采用先进的数码压缩技术,应用了杜比独创的特殊技术,把完全独立的前置左(L)、前置右(R)、中置(C)、左环绕(Ls)、右环绕(Rs)和超重低音(S)六个声道压缩编码成两个声道,记录在电影胶片或影碟上。播放时,再通过解码器还原成六个声道进行播放,往往简称为5.1声道。5.1声道,包括中央声道、前置主左/右声道、后置左/右环绕声道,及所谓的“0.1”重低音声道,总共至少可连接6个音箱。中央声道大部份时间负责重放人物对白的部份;前置主左/右声道则是用来弥补在屏幕中央以外或不能从屏幕看到的动作及其它声音;后置环绕音效则是负责外围及整个背景音乐,让人感觉置身于整个场景的正中央,万马奔腾的震撼、喷射机从头顶呼啸而过的效果,就是拜它所赐;而马达声、轰炸机的声音或是大鼓等震人心弦的重低音,则是由重低音喇叭一手包办。
六个音箱该怎样正确摆设位置呢?两个前置音箱应摆设在屏幕两侧,至于两个音箱之间的间距则视聆听者到屏幕的距离而定,距离愈近,两个音箱则愈靠近,反之亦然,一般来说两个音箱与聆听者大致维持45度的夹角。中央声道音箱置于两个前置音箱的中间,最好与其成一直线。绕环音箱则面对面摆在聆听者的两侧上方60-100公分左右最佳,若两侧无适当架设地点,放置于聆听者后方左右两侧偏高的位置也可达到环境音效的效果;至于重低音箱,由于没有指向性,所以没有一定的摆设位置,视使用者空间的情况而定,一般多置于前方或两侧地板上。
未来的家庭影院应该是杜比AC-3为主流的系统。
(2)DTS
DTS是“Digital Theatre System”的缩写,是“数字化影院系统”的意思,也是美国DTS公司研制的数字时代的电影声音技术标准。
DTS与Dolby Digital完全不同。Dolby Digital是将音效数据存储在电影胶片的齿孔之间,因为空间的限制而必须采用大量的压缩的模式,这样就不得不牺牲部分音质。DTS公司用一种简单的办法解决了这个问题,即把音效数据存储到另外的CD-ROM中,使其与影像数据同步。这样不但空间得到增加,而且数据流量也可以相对变大,更可以将存储音效数据的CD更换,来播放不同的语言版本。
DTS公司推出了多种技术,其中DTS Digital Surround是最广为流传的一种,属于5.1声道系统,人们通常说的DTS技术或DTS环绕,一般就指DTS Digital Surround。DTS Digital Surround采用CAC(Coherent Acoustics Coding,相干声学编码)方式工作,利用心理声学原理,对声轨进行编码和有损数字压缩技术。影院还音时,采取特殊的声画分离的数字立体声,数字声迹录在光盘上,由专用的光盘驱动器读取,另外在拷贝的模拟声迹与画幅之间录有时间同步码,用来控制光驱还音与画面的同步。
DTS公司是一家专注于发展数字影音娱乐的高科技公司,成立于1993年,总部设在美国加利福尼亚州的Agoura Hills,并且在英国、法国、意大利、加拿大、香港、日本和中国均设有分公司。
9、视频压缩
(1)“压缩”一词的本义
1)物理意义:加以压力,以减小体积、大小、持续时间、密度和浓度等。
2)语言意义:化繁为简,在已有的语言基础上,分析筛选,概括提炼重要信息,并加以组织整合。
(2)作为计算机术语的“压缩”:利用算法将文件有损或无损地处理,以达到保留最多文件信息,而令文件体积变小。压缩文件的基本原理是查找文件内的重复字节,并建立一个相同字节的“词典”文件,并用一个代码表示。比如,在文件里有几处有一个相同的词“中华人民共和国”,可用一个代码“*”表示,并写入“词典”文件,这样就可以达到缩小文件的目的。为了有助于理解文件压缩,请您在脑海里想象一幅蓝天白云的图片。对于成千上万单调重复的蓝色像点而言,与其一个一个定义“蓝、蓝、蓝……”长长的一串颜色,还不如告诉电脑:“从这个位置开始存储1117个蓝色像点”来得简洁,而且还能大大节约存储空间。这是一个非常简单的图像压缩的例子。
由于计算机处理的信息是以二进制数的形式表示的,因此压缩软件就是把二进制信息中相同的字符串以特殊字符标记来达到压缩的目的。其实,所有的计算机文件归根结底都是以“1”和“0”的形式存储的,和蓝色像点一样,只要通过合理的数学计算公式,文件的体积都能够被大大压缩以达到“数据无损稠密”的效果。
压缩可以分为有损和无损压缩两种。如果丢失个别的数据不会造成太大的影响,这时忽略它们是个好主意,这就是有损压缩。有损压缩广泛应用于动画、声音和图像文件中,典型的代表就是影碟文件格式mpeg、音乐文件格式mp3和图像文件格式jpg。但是,更多情况下压缩数据必须准确无误,人们便设计出了无损压缩格式,比如常见的zip、rar等。压缩软件(compression software)自然就是利用压缩原理压缩数据的工具,压缩后所生成的文件称为压缩包(archive),体积只有原来的几分之一甚至更小。当然,压缩包已经是另一种文件格式了,如果你想使用其中的数据,首先得用压缩软件把数据还原,这个过程称作解压缩。常见的压缩软件有winzip、winrar等。
(3)视频压缩
1)概念与标准
视频压缩就是对视频进行压缩,又名视频编码,指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。目前,视频流传输中最为重要的编解码标准有国际电信联合会的H.261、H.263,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准,此外在互联网上被广泛应用的还有Real-Networks的Real Video、微软公司的WMV以及Apple公司的Quick Time等。
MPEG是活动图像专家组(Moving Picture Experts Group)的缩写,于1988年成立,是为数字视/音频制定压缩标准的专家组,目前已拥有300多名成员,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG组织最初得到的授权是制定用于“活动图像”编码的各种标准,随后扩充为“及其伴随的音频”及其组合编码。后来针对不同的应用需求,解除了“用于数字存储媒体”的限制,成为现在制定“活动图像和音频编码”标准的组织。MPEG组织制定的各个标准都有不同的目标和应用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21标准。
视频压缩技术是计算机处理视频的前提。视频信号数字化后数据带宽很高,通常在20MB/秒以上,因此计算机很难对之进行保存和处理。采用压缩技术以后通常数据带宽右以降到1-10MB/秒,这们就可以将视频信号保存在计算机中并作相应的处理。常用的算法是由ISO制订的,即JPEG和MPEG算法。JPEG是静态图像压缩标准,适用于连续色调彩色或灰度图像,它包括两部分:一是基于DPCM(空间线性预测)技术的无失真编码,一是基于DCT(离散余弦变换)和哈夫曼编码的有失真算法,前者压缩比很小,主要应用的是后一种算法。在非线性编辑中最常用的是MJPEG算法,即Motion JPEG。它是将视频信号50场/秒(PAL制式)变为25帧/秒,然后按照25帧/秒的速度使用JPEG算法对每一帧压缩。通常压缩倍数在3.5-5倍时可以达到Betacam的图像质量。MPEG算法是适用于动态视频的压缩算法,它除了对单幅图像进行编码外还利用图像序列中的相关原则,将冗余去掉,这样可以大大提高视频的压缩比。前MPEG-I用于VCD节目中,MPEG-II用于VOD、DVD节目中。
2)原理
视频图像数据有极强的相关性,也就是说有大量的冗余信息。其中,冗余信息可分为空域冗余信息和时域冗余信息。压缩技术就是将数据中的冗余信息去掉(去除数据之间的相关性),压缩技术包含帧内图像数据压缩技术、帧间图像数据压缩技术和熵编码压缩技术。
去时域冗余信息 使用帧间编码技术可去除时域冗余信息,它包括以下三部分:①运动补偿。运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。② 运动表示。运动表示就是不同区域的图像需要使用不同的运动矢量来描述运动信息。运动矢量通过熵编码进行压缩。③ 运动估计。运动估计是从视频序列中抽取运动信息的一整套技术。通用的压缩标准都使用基于块的运动估计和运动补偿。
去空域冗余信息 主要使用帧内编码技术和熵编码技术。①变换编码。帧内图像和预测差分信号都有很高的空域冗余信息。变换编码将空域信号变换到另一正交矢量空间,使其相关性下降,数据冗余度减小。②量化编码。经过变换编码后,产生一批变换系数,对这些系数进行量化,使编码器的输出达到一定的位率。这一过程导致精度的降低。③熵编码。熵编码是无损编码。它对变换、量化后得到的系数和运动信息,进行进一步的压缩。
10、音频压缩
声音,是一种波。长期的声学研究发现,人耳存在遮蔽效应。声音信号实际是一种能量波,在空气或其他媒介中传播,人耳对声音能量的多少即响度或声压最直接的反应就是听到这个声音的大小,我们称它为响度,表示响度这种能量的单位为分贝(dB)。即使是同样响度的声音,人们也会因为它们频率不同而感觉到声音大小不同。人耳最容易听到的就是4000Hz的频率,不管频率是否增高或降低,即使是响度在相同的情况下,大家都会觉得声音在变小。但响度降到一定程度时,人耳就听不到了,每一个频率都有着不同的值。
可以看到,这条曲线基本成一个V字型,当频率超过15000Hz时,人耳的会感觉到声音很小,很多听觉不是很好的人,根本就听不到20000Hz的频率,不管响度有多大。当人耳同时听到两个不同频率、不同响度的声音时,响度较小的那个也会被忽略,例如,在白天我们很难听到电脑中散热风扇的声音,晚上却成了噪声源,根据这种原理,编码器可以过滤掉很多听不到的声音,以简化信息复杂度,增加压缩比,而不明显的降低音质。这种遮蔽被称为同时遮蔽效应。但声音A被声音B遮蔽,如果A处于B为中心的遮蔽范围内,遮蔽会更明显,这个范围叫临界带宽。每一种频率的临界带宽都不一样,频率越高的临界带宽越宽。
通常,我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
1) PCM
PCM 脉冲编码调制是Pulse Code Modulation的缩写。PCM编码的最大的优点就是音质好,最大的缺点就是体积大。我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
2)WAVE
这是一种古老的音频文件格式,由微软开发。WAV是一种文件格式,符合 PIFF Resource Interchange File Format规范。所有的WAV都有一个文件头,这个文件头音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。很多朋友没有这个概念,我们拿AVI做个示范,因为AVI和WAV在文件结构上是非常相似的,不过AVI多了一个视频流而已。我们接触到的AVI有很多种,因此我们经常需要安装一些Decode才能观看一些AVI,我们接触到比较多的DivX就是一种视频编码,AVI可以采用DivX编码来压缩视频流,当然也可以使用其他的编码压缩。同样,WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。
在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。
3)MP3
MP3作为目前最为普及的音频压缩格式,各种与MP3相关的软件产品层出不穷,而且更多的硬件产品也开始支持MP3,我们能够买到的VCD/DVD播放机都很多都能够支持MP3,还有更多的便携的MP3播放器等。虽然几大音乐商极其反感这种开放的格式,但也无法阻止这种音频压缩的格式的生存与流传。
MP3发展已经有10个年头了,他是MPEG(Moving Picture Experts Group) Audio Layer-3的简称,是MPEG1的衍生编码方案,1993年由德国Fraunhofer IIS研究院和汤姆生公司合作发展成功。MP3可以做到12:1的惊人压缩比并保持基本可听的音质,在当年硬盘天价的日子里,MP3迅速被用户接受,随着网络的普及,MP3被数以亿计的用户接受。MP3编码技术的发布之初其实是非常不完善的,由于缺乏对声音和人耳听觉的研究,早期的mp3编码器几乎全是以粗暴方式来编码,音质破坏严重。随着新技术的不断导入,mp3编码技术一次一次的被改良,其中有2次重大技术上的改进。
VBR:MP3格式的文件有一个有意思的特征,就是可以边读边放,这也符合流媒体的最基本特征。也就是说播放器可以不用预读文件的全部内容就可以播放,读到哪里播放到哪里,即使是文件有部分损坏。虽然mp3可以有文件头,但对于mp3格式的文件却不是很重要,正因为这种特性,决定了MP3文件的每一段每一帧都可以单独的平均数据速率,而无需特别的解码方案。于是,出现了一种叫VBR(Variable bitrate,动态数据速率)的技术,可以让MP3文件的每一段甚至每一帧都可以有单独的bitrate,这样做的好处就是在保证音质的前提下最大程度的限制了文件的大小。这种技术的优越性是显而易见的,但要运用确实是一件难事,因为这要求编码器知道如何为每一段分配bitrate,这对没有波形分析的编码器而言,这种技术如同虚设。正是如此,VBR技术并没有一出现就显得光彩夺目。
根据人耳的遮蔽效应,专家们设计出人耳听觉心理模型,这个模型被导入到mp3编码中后,导致了一场翻天覆地的音质革命,mp3编码技术一直背负着音质差的恶名,但这个恶名现在已经逐渐被洗脱。到了此时,一直被埋没的VBR技术光彩四射,配合心理模型的运用便现实出强大的诱惑力与杀伤力。
长期来,很多人对MP3印象不好,更多人认为WMA的最佳音质要好过MP3,这种说法是不正确的。在中高码率下,编码得当的MP3要比WMA优秀很多,可以非常接近CD音质,在不太好的硬件设备支持下,没有多少人可以区分两者的差异,这不是神话故事,尽管你以前盲听就可以很轻松区分MP3和CD,但现在你难保证你可以分辨正确。因为MP3是优秀的编码,以前被埋没了。
MP4则是在MP3的基础上,解决并结合了视频的压缩。
4)mp3 PRO
2001年6月14日,美国汤姆森多媒体公司(Thomson Multimedia SA)与佛朗赫弗协会(Fraunhofer Institute)于6月14日发布了一种新的音乐格式版本,名称为mp3 PRO,这是一种基于mp3编码技术的改良方案,从官方公布的特征看来确实相当吸引人。从各方面的资料显示,mp3 PRO并不是一种全新的格式,完全是基于传统mp3编码技术的一种改良,本身最大的技术亮点就在于SBR(Spectral Band Replication 频段复制),这是一种新的音频编码增强算法。它提供了改善低位率情况下音频和语音编码的性能的可能。这种方法可在指定的位率下增加音频的带宽或改善编码效率。SBR最大的优势就是在低数据速率下实现非常高效的编码,与传统的编码技术不同的是,SBR更像是一种后处理技术,因此解码器的算法的优劣直接影响到音质的好坏。高频实际上是由解码器(播放器)产生的,SBR编码的数据更像是一种产生高频的命令集,或者称为指导性的信号源,这有点耥idi的工作方式。
mp3 PRO其实是一种mp3信号流和SBR信号流的混合数据流编码。有关资料显示,SBR技术可以改善低数据流量下的高频音质,改善程度约为30%。
5)WMA
WMA就是Windows Media Audio编码后的文件格式,由微软开发,WMA针对的不是单机市场,是网络。竞争对手就是网络媒体市场中著名的Real Networks。微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质。和以往的编码不同,WMA支持防复制功能,她支持通过Windows Media Rights Manager 加入保护,可以限制播放时间和播放次数甚至于播放的机器等等。WMA支持流技术,即一边读一边播放,因此WMA可以很轻松的实现在线广播,由于是微软的杰作,因此,微软在Windows中加入了对WMA的支持,WMA有着优秀的技术特征,在微软的大力推广下,这种格式被越来越多的人所接受。
6)OGG
Ogg是一种非常有潜力的编码,在各种码率下都有比较惊人的表现,尤其中低码率下。Ogg除了音质好之外,还是一个完全免费的编码。Ogg的高音具有一定的金属味道,因此在编码一些高频要求很高的乐器独奏时,Ogg的这个缺陷会暴露出来。OGG具有流媒体的基本特征,但现在还没有媒体服务软件支持,因此基于ogg的数字广播还无法实现。适用于用更小的存储空间获得更好的音质。
7)APE
一种新兴的无损音频编码,可以提供50-70%的压缩比,虽然比起有损编码来太不值得一提了,但对于追求完美注意的朋友简直是天大的福音。APE可以做到真正的无损,而不是听起来无损,压缩比也要比类似的无损格式要好。音质非常好,适于最高品质的音乐欣赏及收藏。
11、复合与分量
(1)复合,就是先有一个基本的黑白视频信号,然后在每个水平同步脉冲之后,加入一个颜色脉冲和一个亮度信号,进而得到彩色信号。因为视频是由多种数据“叠加”起来的,故名。
复合视频,也叫做基带视频或RCA视频,是National Television Standards Committee,NTSC(美国全国电视系统委员会)电视信号的传统图像数据传输方法,它以模拟波形来传输数据。复合视频包含色差(色调和饱和度)和亮度信息,并将它们同步在消隐脉冲中,用同一信号传输。在快速扫描的NTSC电视中,甚高频(VHF)或超高频(UHF)载波是复合视频所使用的调整振幅,这使产生的信号大约有6MHz宽。一些闭路电视系统使用同轴电缆近距离传输复合视频,一些DVD播放器和视频磁带录像机(VCR)通过拾音插座提供复合视频输入和输出,这个插座也叫做RCA连接器。复合视频中,色差和亮度信息的干涉是不可避免的,特别是在信号微弱的时候。
(2)分量,就是为了提高信号的质量,把亮度和色度信号分开传递。有YUV两种RGB分量方法。
在YUV中,“Y”代表明亮度(Luminance或Luma),也就是灰阶值;而“U”和“V”表示的则是色度(Chrominance或Chroma),作用是描述图像色彩及饱和度,用于指定像素的颜色。
在RGB中,“亮度”是通过RGB输入信号来创建的,方法是将RGB信号的特定部分叠加到一起。色度则定义了颜色的两个方面――色调与饱和度,分别用Cr和Cb来表示。其中,Cr反映了RGB输入信号红色部分与RGB信号亮度值之间的差异,而Cb反映的是RGB输入信号蓝色部分与RGB信号亮度值之间的差异,此即“色差信号”,也就是我们常说的分量信号(Y、R-Y、B-Y)。
色差分为逐行和隔行显示,一般来说分量接口上面都会有几个字母来表示逐行和隔行的。用Y/Cb/Cr表示的是隔行,用Y/Pb/Pr表示则是逐行,如果电视只有Y/Cb/Cr分量端子的话,则说明电视不能支持逐行分量,而用Y/Pb/Pr分量端子的话,便说明支持逐行和隔行2种分量了。
分量色差传送的视频有多种方式,例如将三原色直接传送的RGB方式,将所有的颜色作同等处理,拥有最高的画质,在专业的彩色监视器及电脑显示器上均以此种方式。但由于RGB方式对传输带宽和存储空间消耗太大,为节省传输带宽,还使用分量色差方式,从RGB转换为亮度(Y)与色差(Cb/Cr或Pb/Pr,分别代表隔行扫描及逐行扫描)。分量/色差端子采用三个同轴端子,对应的端子分别标记为绿色(亮度)、红色(色调)和蓝色(饱和度),这也成为目前家用级视频器材上的主流方式。
分量视频的采样有4:2:2、4:1:1、4:2:0、4:4:4四种结构,分别表示亮度信号与色度信号的不同比例。
二?一?年二月三日于北京