电视会议系统
出自 MBA智库百科(https://wiki.mbalib.com/)
电视会议系统(TV Conference System/Television Conference System)
目录 |
电视会议是利用电视技术和设备通过传输信道在两地或多个地点进行会议的一种通信方式。它将一个会场点的开会人的形象、发言及报告内容用摄像机、麦克风及图文制作机等设备传送到另一会场点,同样本方会场也能收到对方的图像、语音及图文信息。这样,双方就可以进行交流,增加了临场感。它是现代计算机技术、通讯技术、网络技术、图像技术紧密结合的产物。电视会议系统成为近年来发展最迅速的新型业务之一。在国内,电视会议系统于1994年首次在电信网中使用,1995年11月电视会议系统正式投入商用;近几年来随着广电、铁路等网络的开通,电视会议系统的应用更加广泛。
电视会议是两地或多地点间的双向通信,它不仅传送语音、数据,而且还传送实时的活动图像,但由于活动图像是连续的数据流,多个信道间不能直接连接,否则来自不同地方的图像将重叠在一起,无法分辨。因此一个完整的电视会议网,不仅有电视会议系统、传输网络,而且应设置多点控制设备(MCU),以进行图像的切换、语音的混合切换及数据的分流。电视会议系统由网络、终端、多点控制单元三部分组成,具体如下:
1. 网络
传输网络是电视会议信息传输的通道,目前电视会议业务可以在多种通信网络中展开,例如:SDH数字通信网、ISDN(综合数字业务网)、LAN(局域网)、Internet、ATM、DDN(数字数据网)、PSTN(公共交换电信网)等等,其传输介质可以采用光缆、电缆、微波以及卫星等数字信道,或者其他类型的传输通道,在用户接入网范围内,可以使用HDSL(高速数字用户线路)、ADSL(非对称数字用户线路)、HFC网络等设备进行传输。当前,我国的电视会议主要在广电网和电信网中召开。
2.终端设备
终端设备指用户在召开电视会议时所用的终端设施的总合,它由视频、音频的输入、输出设备和接口电路二部分组成:
(1)视频、音频的输入、输出设备
视、音频(A、V)的输入设备基本为摄像机和麦克风,摄像机为数字摄像机,根据会场的规模1台到3台,视频信号同麦克风的声音信号经视音频分配器和视音频切换器,接入接口电路。
(2)接口电路
接口电路根据网络中传输的信号不同而有很大差异,当网络传输数字信号时,接口电路就是编码器和解码器:当网络传输调频.调幅模块信号时,接口电路就是调频、调幅光发射机和光接收机。
3.多点控制单元(MCU Multipoint Control Unit)
电视会议业务是一种多点之间双向通信业务,限于目前的网络,多点间电视会议信号的切换必须用专用的设备多点控制单元MCU来完成。MCU是整个会议电视网的控制中心。MCU在一个会议电视网中可以有多个,但并不是无限增加的,也不是任意连接的,应根据相应的国际标准和传输控制协议。
MCU和终端的连接网呈星形状态,通常放置在星形网络的中心处,即参加会议的各个终端都以双向通信的方式和 MCU相连接,由于 MCU端口数是有一定限制的,因此,在遇到会议点特别多的情况时,可以级连多个MCU来使用,但同一级级连一般不多于2级
处在上面的一层的MCU是上层MCU,处在下层的 MCU为从 MCU,从MCU受控于上层MCU。在电信网中,MCU是专用设备,它主要对图像、声音和信道进行不同的处理,进行切换、控制。在广电网中;MCU主要有视音频分配器和视音频切换器,对会场的视、音频进行直接切换.控制。
根据电视会议系统利用的传输网络不同,电视会议系统分成基于窄带ISDN的电视会议系统(H.320)、基于PSTN的电视会议系统(H.324)、基于IP网络的电视会议系统(H.323 v2)以及基于ATM网络的电视会议系统(H.321)。下面就对H.320,H.324, H.323 v2三种进行简要的介绍:
1.基于窄带ISDN的电视会议系统(H.320)
基于窄带的ISDN的电视会议系统符合ITU-T的H.320 建议。其使用带宽为N×64kbps(N取1~30),它是目前使用较多的电视会议系统。该类型产品可以利用数字传输网、DDN、ISDN等网络,目前国内普遍使用数字传输网的形式,部分单位使用由DDN组成的网,采用ISDN形式的终端其速率一般较低,但是在384kbps的带宽下可以以合理的成本提供高质量的音频和视频信号。
基于窄带的ISDN的电视会议系统其视频编码采用H.261建议(部分产品支持H.263以及H.263+),该种编码方案是采用基于图像块的方式进行编码的,采用帧间预测和帧内预测编码混合的混合编码,利用DCT变换、运动估计和补偿等技术来减少预测误差,提高系统的压缩比。
该类型系统的语音编码采用ITU-T的G.711、G.722或者G.728,能够提供较好的音质,其图像格式主要采用CIF(中间图像格式),该格式分辨率为352×288,其帧速率一般为29.97。数据共享的功能是利用T.120建议来实现的,通过外接的计算机,可以利用电视会议系统的传输网络实现文件的传送、电子白板以及桌面共享功能。
基于窄带ISDN的电视会议系统是基于电路交换的,它能够提供服务质量(QoS)保证,可靠性高,而且目前有大量用户安装使用,尽管其通讯成本相对于现有的其他方式略显昂贵,仍然会得到发展。
2.基于PSTN的电视会议系统(H.324)
基于PSTN的电视会议系统符合ITU-T的H.324建议,H.324建议类似H.320建议,它提供了在64k带宽下的可视电话的规范,其编解码采用更适合低码率的H.263建议(或H.263+建议),能够在该码率下得到比H.261编码更好的图像效果。音频压缩则采用ITU-T的 G.723.1建议,其码率为5.3kbps或6.4kbps。
高昂的成本一直是可视电话普及的一个障碍,随着宽带互联网和计算机处理能力的大幅度提高,该种应用目标最终会由软件进行编解码来代替。由于采用H.324建议能够利用普通的公众电话网提供图像和语音信息,目前该项技术也应用于远程监控系统中。
3. 基于IP网络的电视会议系统(H.323v2)
基于IP网络的电视会议系统符合ITU-T的H.323 v2建议,它采用LAN或者Internet作为通信网络,由于计算机网络的迅速发展,使得Internet网络已经成为仅次于PSTN的第2大网,而且 IP网络可能最终统一各种网络。由于基于IP网络的电视会议系统初始建设成本较低,使用成本亦较低,可以充分利用目前存在的网络,而且由于基于H.323 v2的系统采用计算机作为其承载,可以和其它媒体在计算机中进行混合,功能多,控制灵活,因而得到了很大的发展,正成为会议电视的主流。
根据H.323 v2建议,基于IP网络的电视会议系统由会议终端、网关(gateway)、网闸(gatekeeper)、IP网络以及多点控制单元组成。
在H.323 v2建议中,采用的图像编解码格式有H.261、H.263、H263+。H.263以及H.263+能够对图像提供更大的压缩速率,能够在低码率下提供比H.261更好的图像质量,因而更适合IP网络应用
音频编码格式必须兼容G.711语音编码,另外也可以选择使用G.722、G.723.1,G.728,G.729或MPEG-1的语音编码标准。
基于IP网络的电视会议系统采用了分组交换技术,因为分组交换不保障有序性和固定延时,因而不能保证有固定的延时和带宽。为了较好解决实时通信的业务质量,采用了UDP/IP、RTP、RTCP以及RSVP等协议.
随着技术的发展,特别是宽带通讯的日益普及,会议电视的应用越来越广泛,对其视频音频质量、数据共享、灵活性以及易用性、可*性和易管理性的要求越来越严格随着电视会议系统的逐步应用,电视会议系统正朝着样式多样化、功能全、应用广泛、宽带高清晰等方向发展。电视会议系统的功能将比现在更齐全,更加利于人的使用,而且可将其应用于远程教育,远程医疗,远程协作等。在未来发展中,电视会议必将同广播电视融为一体,形成一个巨大的以传输网为基础的图像通信的综合体,随着技术的提高,成本不断降低,运营费用也随之降低,电视会议将成为未来通信的热点。
- 电视会议系统的优点
有专门的会议室,从某种角度看,它更象一个真正的会议系统,所以又可称之为Room-based会议系统。
大都使用专用设备,如专用的电视摄像机、麦克风、白板系统,租用的高带宽的专用线路,专用的多点控制单元(MCU),所有电视会议系统有更好的实时视频率、音频效果,也就有更好的临场感。
由于有专用的会议室和会议控制设备,可以提供强有力的会议控制。
- 电视会议系统的缺点
由于用的是专用设备,所以价格相对要昂贵得多,而且设备除会议之外的通用性较差。
由于使用会议室,受到人数、地理位置的限制。
创建一套电视会议系统比创建一个计算机会议系统苦难得多,还需要专人维护、不如计算机系统灵活。
- 远程教育应用 ———利用视讯会议开展教学活动,使更多、更大范围的学生能够聆听优秀教师的教学,在美国、欧洲较为流行,许多大学建有其远程教育网络,数百万学生通过交互视讯会议系统接受教育。另外,远程培训在各大企业也越来越受到关注。
- 远程医疗应用 ———利用视讯业务实现中心医院与基层医院就疑难病症进行会诊、指导治疗与护理、对基层医务人员的医学培训等等。高质量的视讯业务使医生、护士在不同地方同时协同工作成为可能。远程医疗对于一些中小医院有着重要的意义,可以得到大医院的医学专家的咨询和会诊。
- 项目协同工作应用 ———也是进行远程项目管理的非常好的工具,突出特点是资源共享。项目组的成员能进行远程协作,使地理上分开的工作组以更高的速率和灵活性以电子方式组织起来。许多美国大公司与其分公司间通过数字链路,利用桌面视讯会议,实现整个公司的办公自动化,相关人员可以在屏幕上共同修改文本、图表。
- 政府行政会议应用 ———我国幅员辽阔,各级政府会议频繁,视讯会议系统是一种现代化召开会议的多快好省的方法,它可使上级文件内容即时下达,使下级与会者面对面地讨论和深刻领会上级精神,使上级指示及时得到贯彻执行。运营商用视讯业务的条件。
而这样的势头只会越来越强劲。国内外大型网络运营商对网络环境的建设和改造;ISDN、DDN、VPN、xDSL、ATM等技术的应用和推广;视音频编解码技术趋于成熟;公众对网络会议认知度的不断提高等等因素正在让视频会议系统逐渐走入“平民化”的道路。而H.323(IP视频及语言通讯网络)、 H.324(3G及PSTN视频通讯)以及T.120(数据会议)等等标准协议也将会在IP技术以及IP网络迅猛发展的带动下悄悄的主流化。
1990年原 CCITT(原国际电报电话咨询委员会,即现在的ITU-T,国际电信联盟)通过了电视会议、可视电话的H.0261建议以及后来的H.320系列标准,对电视会议的各种技术标准作了完整的规定,为各种产品的国际互通提供了保证。
H.261标准是用于电视电话和电视会议。H.261编解码器采用基于像素块的编解码方法,采用DCT变换与量化,运动估计和补偿等措施可以在较低码率下提供一定质量的图像。
随后的H.263标准在低码率下能够提供比H.261更好的图像效果,为了进一步提高压缩比,H.263中采用了更复杂的二维预测,而且利用半像素精度,以提高预测误差的精度,另外H.263还提出了4种有效的压缩编码方法供选用。
1998年IUT-T推出的H.263+是H.263建议的第2版,它提供了12个新的可协商模式和其他特征,进一步提高了压缩编码性能。如 H.263只有5种视频源格式,H.263+允许使用更多的源格式,图像时钟频率也有多种选择,拓宽应用范围;另一重要的改进是可扩展性,它允许多显示率、多速率及多分辨率,增强了视频信息在易误码、易丢包异构网络环境下的传输。另外,H.263+对H.263中的不受限运动矢量模式进行了改进,加上12个新增的可选模式,不仅提高了编码性能,而且增强了应用的灵活性。
目前国内的电视会议系统主要是基于H.320的系统,这种系统能够在384kbps的带宽下以合理的成本提供高质量的音频和视频信号。由于互联网的迅速发展,近年来基于H.323标准的系统得到了很大的发展,正发展成电视会议的主流技术。
随着宽带网络的普及以及对更高质量的图像和语音质量的要求,目前已经出现了采用MPEG-2的电视会议系统。MPEG-2和H.261都属于经典的基于像素的压缩编码方案。
MPEG-2是数字视频压缩的重要标准,它通过使用离散余弦变换和运动补偿,对运动图像从空间和时间上进行压缩编码,使得编码后的位流适合于传输、通信、存储、编辑等方面的要求。采用MPEG-2编码方案图像分辨率是传统H.261会议电视的4倍,能够得到广播级的图像和语音,但是需要更加宽的带宽,而且系统的成本比较高昂。
MPEG-4标准既能够支持码率低于64kbit/s的视频应用,也能够支持广播级的视频应用。与其他压缩标准相比,MPEG-4标准在DCT的基础上引入了图像模型的概念从而具有更高的压缩效率。在传统电视会议的带宽下,图像达到500线以上的分辨率,充分满足了对图像有高质量要求的用户需求。
随着基于IP网络的会议电视的发展,针对目前的实际需要,目前已经有部分公司推出了采用流媒体技术的电视会议系统,该类系统类似于目前的Real、 Quicktime、ASF等形式,但它突出交流的方便,而不是单方面的广播。
图像、声音采用模拟信号传输时占用频带宽,远距离传输难,因此必须采用数字信号传输;但视、音频信号数字化后数据率很高,直接用于电视会议显然不可取,必须采用信息压缩编码技术。压缩编码包括信源编码和信道编码。
1.信源编码
信源编码包括视频压缩编码和语音压缩编码。
视频压缩编码有以下几种方式:
(1)差值脉冲编码
在连续变化的图像中,相邻帧间的相应位置的变化很小,即前后帧间相应像素之差为零或差值小的概率大,差值大的概率小。差值脉冲编码 DPCM(Differential Pulse Code Modulation)这一原理.发端将当前帧和前一帧相关样值相减所得差值经量化后进行传输。接收端将收到差值同前一帧相关样值相加得当前帧样值,由于差值小幅度出现的概率大,总码率将减小。
(2)预测编码
预测编码(Predictiv Coding)不仅利用前后样值的相关性,同时也利用其它行、其它帧的象素的相关性.用更接近当前样值的预测值与当前样值相减,小幅度样值的概率会进一步增加。JPEG是典型的帧内编码方案,主要用于静止图像;用到前后帧像素的处理称为帧间编码,MPEG是帧间编码;主要用于对运动图像的处理。
(3)变换编码
变换编码(Transform Coding)用一种符合图像本身内在特性的变换,把原来的图像样值变成一个更利于进行统计编码的新序列,提高效率的编码方法。当前常用的变换编码是 DCT(Disciete Cosine Transform)即离散余弦变换,DCT是先将整体分成N×N像块逐一进行DCT变换。由于大多数图象的高频分量较少,相应于图像高频成分的系数经常为零加上人眼对高频成分的失真不太敏感,所以可用更粗的量化,因此传送变换系数所用的数码率要大大小于传送图像象素所用的数码率。
(4)量化,之字型读出和游程编码
量化;根据人眼对低频分量敏感,对高频分量不太敏感的生理特点,对DCT变换后系数的低频分量采用较细量化,高频分量采用较粗量化,这样会使大多数高频分量的系数为零。
之字型读出:读出数据时,按之字的形态读出。由于经DCT变换以后,系数大多数集中于左上角,即低频分量区,因此之字型读出是按二维频率的高低顺序读出系数的,这就为游程长度编码创造条件。
游程长度编码(RunLengrt Encoding):指一个码可同时表示码的值和前面有几个零,这样就可以把之字型读出的优点显示出来。因为之字型读出在大多数情况下出现连零的机会比较多,尤其在最后,如果都是零,在读到最后一个数后,只要给出“块结束”(EOB)码,就可以结束输出,节省码率。
(5)霍夫曼编码
霍夫曼编码(Huffman)是可变字长编码的一种,对概率大的符号给短码,对概率小的符号给长码。具体方法。先按出现的概率大小排队,把两个最小的概率相加,作为新的概率和剩余的概率重新排队,再把最小的两个概率相加,再重新排队,直到最后变成1。霍夫曼编码的另一个好处是,任何短码都不会是长码的起始部分,这样就可以把各码字直接相连而不需要增加其它形式的间隔。
(6)运动估值和运动补偿
运动估值和运动补偿是MPEG-2的一大特点。实际上,图像数据的多余成份大多在时间方向。例如;一秒的静止图像相当于25帧相同的图像,即使是活动图像,许多情况也只是很少一部分图像在运动,因此只要对活动部分进行编码即可。进一步说,即使有大范围的活动部分,前后帧尽管有很大的区别,但移动物体本身大多数情况下是相同的,只要知道移动物体具体移动了多少,就可以在前一帧找到相应图像的内容,这时只要传送相应图像内容不同的部分就可以了。找到图像中某一部分运动多少的过程称为运动补偿。
一般说来,语音信息比图像信息要少的多,但和文本信息比。仍然显得比较庞大,必须对它进行压缩处理。语音压缩编码有如下几种形式:
(1)波形压缩
对数PCM:对出现概率大的小幅度信号采用量化步长小,出现概率小的大幅度信号采用量化步长大,输入、输出信号吴对数特性。
自适应差分(ADPCM):其原理同差值编码和预测编码相类似。
子带分割:对音频信号用正交镜像滤波器(QMF)分成高子带(4kHz-7kHz)和低于带(okH-4kHZ)两部分,分别进行ADPCM编码,再送到混合器混合;形成输出码流输出。
(2)参数压缩
根据语音产生的机理,对发音模型的有关参数进行编码,其中常用的是线性预测编码(LPC)。
(3)混合压缩法
波形压缩法音质差,LPC简单,但合成语音波形同原语音波形差别较大,因此将波形压缩法同参数压缩法有机结合,这样合成后的语音质量得到改善,这种压缩法叫混合压缩法。
2.信道编码
当数据在信道上传输时.由于传输信道特性不理想;以及外界的电磁干扰,会使所传的码流产生误码,信道编码的主要目的就是要设法检测并纠正这一类误码。在电视会议系统中,信道编码主要是指差错控制编码,它包括自动请求重发(ARQ),前向纠错(FEC),混合纠错(HEC)(前二种方式的结合),其中常用的是前向纠错。前向纠错主要有三种:
(1)奇偶校验码
字符最后一位为校验位,使总的比特模2和为“1”,采用1个校验只能发现1个错误比特,如果有两个或两个以上的比特发生错误,奇偶校验位就不能保证可以发现了。
(2)汉明码
以(7,4)汉明码为例,其中4位为信息码元,3位为校验码元,校验码元由信息码元计算机给出;它可纠正1位错误或者检测两位误码。
(3)循环码
在循环码的码字集合中,任两个码字的模2和必定为该集合中的一个码字;而且任一码字循环以后,仍为该码集合中的一员。循环码具有循环性和封闭性,具有较强的检测、纠错能力。
对于大多数用户来说,对视频会议系统最为关注的因素主要有以下几个方面:音视频质量、系统价格、系统的安全和可扩展性。当前普遍存在的网络环境主要有两种情况,一种是基于电路交换的网络,如ISDN、DDN、PSTN等。另一种是基于包交换的网络,如ATM、IP、帧中继等。熔点网讯