本文以视频i7105高清机顶盒为基础,采用SIP协议,尽量利用高清互动机顶盒的现有编解码能力实现视频通话功能。该方案充分利用了机顶盒的现有模块及HFC网络,但是对语音和视频的压缩度不高。随着科学技术特别是多媒体通信技术的发展,传统的语音电话模式越来越不能满足现代人之间信息交流的需求。随着图像、音频、视频等多媒体数据逐渐成为信息处理领域中的主要媒体表现形式,与传统语音电话相比,视频电话可以更加吸引用户,并可以有效地利用网络资源,大大降低成本。有线电视网络在业务上已经实现视频、数据业务,为适应我国大力推进"三网融合"的步伐,必须能够实现通信业务,所以实现视频通话是一项很好的选择。
1STi7105芯片简介
STi7105是意法半导体公司生产的一款高性能高清数字电视机顶盒解码芯片,采用先进的半导体生产工艺及完善的优化设计,提升各个功能模块的性能,增加高速数据接口,降低耗电量,降低系统的整体材料成本。STi7105是一款应用范围很广的SoC芯片,可以用于有线高清数字电视机顶盒、卫星高清数字电视机顶盒、IPTV机顶盒、多媒体手持设备等。STi7105芯片的结构示意图如图1。
STi7105芯片内部集成了一颗高性能的ST40应用程序处理器,主频高达450MHz,实时处理运算能力超过800DMIPS,另外芯片内还集成有两颗实时运算加速器,也可以用于各种运算要求的处理。这样的处理能力不但可以达到高清机顶盒的要求,还能够充分满足家庭多媒体中心的设计需求。
STi7105的TS流输入处理模块可以支持4路TS流输入、1路TS流输出,这个处理模块内可以同时处理分解多个码流,用于同时进行录像、码流回放、画中画等功能,这些码流可以来自传统的数字电视广播通道,也可以来自CableModem、EoC、以太网等IP通道,该模块能为用户提供灵活的产品开发模式。
STi7105集成了高性能的视音频解码器,其灵活的解码架构可以满足目前已有的各种视音频编码压缩格式的解码要求,也可以通过软件升级来支持这些标准。在视频编解码方面,它可以支持H.264HP@HL4.1、MPEG-2MP@HL、VC-1MP@HL、AP@L3、MPEG-4P2ASP@L5、DiVx格式、RM、RMVB、AVS等视频格式,其解码器可以用于PVR、画中画功能,支持1080p的格式,内置的图像降噪声处理,增强优化的后处理电路能够给用户带来前所未有的优美图像。在音频编解码器方面,可以支持MPEG-1layerI/II、MP3、MPEG-2layerII、AC-3DolbyDigital、DD+、AAC、AAC+SBR等等,也可支持杜比、DTS的新算法及中国DRA音频标准。
STi7105除视音频解码功能以外,还具有一定的视音频的编码的能力,支持DivX、XviD、H.263编码格式。
2实现及应用
2.1技术协议
视频通话终端软件的开发和应用涉及许多方面的技术,包括信令协议、分组语音技术、视频编解码技术以及流媒体网络传输技术等。
2.1.1信令协议
信令指各个交换局在完成呼叫接续中的一种通信语言,在通信设备之间传递的各种控制信号,如占用、释放、设备忙闲状态、被叫用户号码等,都属于信令。信令系统指导系统各个部分相互配合,协同运行,共同完成某项任务。目前国际上IP网络通信的主要标准有H.323和SIP(Session Initiation Protocol),两者都对视频电话系统信令提出了完整的解决方案,都是作为多媒体通信的应用层控制(信令)协议,都利用RTP作为媒体传输协议。但是两者的设计风格截然不同,H.323采用的是传统的电话信令模式,包括一系列协议;而SIP借鉴其他互联网协议,采用基于文本的协议。
SIP协议由于其简单、易于扩展、便于实现等诸多优点越来越得到通信业界的青睐,SIP在现有通信网向NGN演进过程中十分重要,正在成为NGN(下一代网络)的核心协议之一,而且SIP协议已经被3GPP工作组定义为第三代移动通信系统的信令协议以提供IP多媒体服务,本方案采用SIP作为信令协议。
SIP协议是IETF制订用于多方多媒体通信,主要目的是为了解决IP网中的信令控制以及同软交换机的通信,从而构成新一代的通信平台。SIP协议采用客户机/服务器的工作方式,SIP网络包含两类组件:用户代理(UserAgent)和网络服务器(NetworkServer)。
用户代理(UA)表示一个终端系统,包括用户代理客户端(UAC)和用户代理服务器端(UAS),前者产生请求,后者产生对应的响应。UAC和UAS是逻辑上的两个部分,每个终端系统都包含了UAC和UAS的功能。
SIP是一个分层体系结构的协议,第1层是语法和编码层,它的编码使用扩展的巴科斯范式规定;第2层是传输层,它定义了网络上的客户机和服务器如何接收请求和发送响应;第3层是事务层,事务是SIP的基本元素,事务由客户机向服务器发送的请求和从服务器发回客户机的所有响应组成,事务层若处理消息超时,则重传并匹配响应到请求;第3层是用户层,每个SIP实体(除了无状态代理)都是事务用户,当一个事务用户希望发送请求时,就创建一个客户机事务实例以发送此请求。SIP提供用户定位、用户通信能力协商、用户可用性、建立呼叫和呼叫处理与控制等功能。SIP不提供具体的业务,不定义会话将如何描述,只提供会话建立功能。SIP协议清晰地将会话建立和会话描述区分开,使SIP可以成为Internet上多媒体会话中真正意义上的信令协议,适用范围很广。
2.1.2视频编码技术
视频压缩是多媒体应用中的核心技术,ITU-T推出的低码率视频压缩标准对推动可视电话的发展和实用化起到了重要的促进作用。H.261是ITU-T推出的第一个低码率视频压缩标准,码率为P×64kbps,其中P在1~30中取值,图像格式为CIF和QCIF.H.261压缩编码算法的基本思想是利用预测编码减少时间冗余度,利用变换编码减少空间冗余度。算法主要由运动估计、运动补偿、DCT变换、量化和霍夫曼编码构成。
H.263是最早用于低码率视频编码的ITU-T标准,随后出现的第二版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。
它是在H.261基础上发展起来的,其标准输入图像格式可以是S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。H.263与H.261相比采用了半像素的运动补偿,并增加了4种有效的压缩编码模式。
H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准。对信道时延的适应性较强,既可工作于低时延模式以满足实时业务,又可工作于无时延限制的场合。在编解码器中采用复杂度可分级设计,在图像质量和编码处理之间可分级,以适应不同复杂度的应用,提高网络适应性。相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括4×4整数变换、空域内的帧内预测、1/4像素精度的运动估计、多参考帧与多种大小块的帧间预测技术等。
H.261与H.263在视频通信中应用较广,H.263与H.261相比,增加了若干选项,提供了更灵活的编码方式,压缩效率大大提高,更适应网络传输。H.264标准的推出,是视频编码标准的一次里程碑式的重要进步,它与H.263、H.261相比,具有明显的优势,特别是编码效率的提高,使之能用于许多新的领域。由于STi7105芯片视频编码能力有限,所以我们视频编码选用H.263格式。
2.1.3音频编码技术
语音通信是可视电话最基本的功能,受网络条件的限制,可视电话通常在较低码率下工作。ITU-T推出了一系列语音压缩标准,其中有G.711、G.723.1、G.728、G.729和G.729A等,在可视电话中得到了广泛应用。当可视电话与普通电话通信时,采用G.711标准,G.711为PCM编码,只对语音信号进行采样和量化,产生64kbps的码流,G.711编码后的语音质量高,缺点是占用的带宽也很高。G.723.1能够产生两种速率的码流,高速率编码器使用多脉冲最大自然量化(MP-MLQ)算法,低速率编码器使用代数码激励线性预测(ACELP)算法。G.729A是G.729的简化版本,其复杂度与G.729相比降低了50%,语音质量略有降低,两种标准编码后的码流可互相解码。
实际选择语音编解码算法时,要考虑各种因素,高比特率可以保证良好的语音品质,但要占用大量存储空间,耗费更多资源;而过低的比特率会影响语音的品质增加延迟。由于STi7105芯片音频处理能力有限,所以我们音频编码选用G.711、G.723.1格式。
2.2系统结构
视频通话测试系统主要由服务器、传输网络和STi7105机顶盒终端组成。
服务器用来控制整个系统的通话过程,服务器的基本功能是按照用户的要求完成对信令、ST、话音等信号切换,保证音频及视频的连续性。