1.概述 H.324是低碼率的通信終端建議,它包括利用V.34 Modem在PSTN上傳輸的低碼率多媒體電話終端建議。
H.324終端可以集成在PC或工作站中,亦可像可視電話那樣單機實現。它可以實時地進行語音、數據及視頻的通信,各種媒體(語音、數據、視頻)可以單獨傳送,亦可以組合傳送。通信可以是單向的,也可以是雙向的。使用多點控制器(MCU)可以實現多點通信。
H.324系列建議還包括H.223復用建議、H.245控制建議、H.263視頻編解碼建議及G.723音頻編解碼建議等。
H.324終端可以和在ISDN上傳輸的H.320系列建議的可視電話系統互動工作,亦可在無線行動電話網路中工作(稱為H.324/M建議)。
2.H.324終端方框圖及功能單元 圖1為通用的多媒體可視電話系統方框圖,它包括H.324建議終端、PSTN、MCU及輸入輸出設備等。
圖1中的虛線框內為H.324建議所涉及的範圍,它包括下面一些單元。
① 視頻編解碼器(H.263或H.261)——完成視頻數據流的冗餘壓縮編碼和解碼。
② 音頻編解碼器(G.723)——它對拾音器來的音頻信號進行壓縮編碼後傳送出去,對接收到的音頻碼流進行解碼並輸出至揚聲器。在音頻接收通道中加入可選的延遲單元以補償視頻的延遲,達到聲像同步。
③ 數據協定——支持電子白板、靜止圖像傳輸、檔案交換、資料庫訪問、聲像會議等數據套用業務。數據套用的標準包括T.120實時聲像會議、T.84簡單的點與點間靜止圖像檔案傳輸、T.434簡單的點與點間檔案傳輸、H.224/H.281遠端攝像機控制、使用緩衝的V.14或LAPM/V.42的用戶數據傳輸。其他的套用和協定也可通過H.245協商使用。
④ 控制協定(H.245)——提供H.324終端端對端間相應操作的信令,並提供其他所有端對端系統功能的信號,包括僅使用模擬電話模式的信號。它還提供能力的交換、命令及指示信號、打開及描述邏輯信道的訊息。
⑤ 復用協定(H.223)——將需傳送的視頻、音頻、數據及控制數據流復用成單一碼流,並將接收到的數據碼流解復用成各種多媒體數據流。另外,它還執行邏輯分幀、序列編號、誤碼檢測,對於每一種媒體使用不同的方法重傳使之進行誤差校正。
⑥ 調製解碼器(V.34)——將H.223同步復用碼流轉換為在GSTN網上傳輸的模擬信號,並把接收到的模擬信號轉換為同步碼流並送至復用/解復協定單元。當帶有網路信令及V.8/V.8bis功能單元為一獨立的物理單元的調製解碼器使用時V.25ter用來提供數據機與網路接口的控制及狀態檢測。
在圖1中虛線框外還有許多系統設備,它包括:
① 視頻輸入輸出設備——包括攝像機和監視器及其控制與選擇,其中還具有提高壓縮比及提供分屏功能的視頻處理。
② 音頻輸入輸出設備——包括拾音器、揚聲器、電話及其音頻附屬設備,以提供話音激勵檢測、多拾音器混合及聲音回波抵消。
③ 數據套用設備—包括計算機、非標準的數據套用設備、電子白板等遠程可視輔助服務設備。
④ PSTN網路接口——按國際標準支持相應的信令、撥號振鈴功能及電壓電平。
⑤ 用戶系統控制設備——包括用戶接口及操作。
3.H.324終端功能要求 H.324終端中V.34 Modem、H.223復用及H.245系統控制協定是必需的,而其他功能設備則根據需要設定。
多媒體信息流包括視頻、音頻、數據及控制等碼流。
視頻碼流是攜帶運動圖像彩色信息的連續數據流,在運行時視頻的有效碼流可按音頻及數據通道需要而改變。
音頻碼流是實時碼流,在接收機中為保持與視頻流的同步,應在接收處理通道中加入可選延遲。為了減少音頻數據流的平均碼率,可以採用話音激勵方法來進行編碼。
數據信息流可以是靜止圖像、傳真、文本、計算機檔案、計算機套用數據、未定義的用戶數據及其他數據信息流。
控制信息流傳遞控制命令和指令。當採用由單獨的物理接口連通的Modem時終端與Modem之間的控制按照V.25ter進行。終端與終端間的控制按照H.245建議操作。
(1)Modem
H.324終端所用的Modem 按照ITU-T V.34及ITU-T V.8的全雙工和同步的模式工作。V.8將由V.8bis所代替。H.223的復用輸出將直接作用至V.34同步數據端。若採用外接的Modem時,Modem及終端之間的控制將按照ITU-T V.25ter建議運行,此時其物理接口將按規定實現。
(2)復用器
視頻、音頻、數據或控制信息的邏輯信道可按照H.245建議建立的進程進行傳送。邏輯信道是單方向的,且與傳送的方向無關。除了H.245的控制信道的邏輯編號必須為零外,其他各種媒體可以在任意編號的信道上傳送。傳送這些邏輯信道的復用方法應按照H.223建議進行。
H.223復用器由復用層及適配層組成。復用層將各邏輯信道來的信息混合成一個單一的碼流。適配層則對每一種信息碼流進行誤差控制、序列編號。復用層將邏輯信道信息打成稱為MUX-PDU的包進行傳送,這個包使用HDLC標誌,並使用HDLC的0比特插入透明傳輸。
H.324終端將通過H.245的H.223能力信息通知它的H.223的復用能力。
每一個邏輯信道由一個邏輯信道編號(LCN)來進行識別,編號從0至65535。除了H.245控制信道的邏輯信道編號固定為零外,其他邏輯信道的編號可任意選擇。
H.223定義了三個適配層AL1、AL2及AL3。AL1主要用於可變碼率的組幀信息,包括作為不定長單幀的未組幀8位信息。AL2主要用於數字音頻信息,包括8位CRC校驗碼及可選序列編號。AL3主要用於數字視頻信息,並提供重傳功能。
在H.223復用單元與音頻編解碼器、視頻編解碼器、數據協定或控制協定之間的信息交換的邏輯單元稱為AL-SDU。根據H.223中的定義及信道打開時H.245發出的信號,H.223復用器所傳送的邏輯信道可分為可分段和不可分段兩種類型。可分段的邏輯信道的AL-SDU可由H.223復用器所分段,不可分段邏輯信道的AL-SDU不能被H.223復用器所分段。一般來說,可分段信道應由控制視頻及數據等可變碼率的信息流使用,而不可分段信道則應由音頻等恆定碼率的信息流使用。
根據H.245建議,接收端應發出信號,告知其處理各種適配層的能力及信道類型。而傳送端則應根據H.245建議,在信道打開時發出適配層選擇及信道類型的信息。
(3)控制信道(Control Channel)
控制信道載送端到端的執行H.324系統控制的控制訊息,它包括能力交換、邏輯信道的開放和關閉、模式優先請求、復用表條目傳輸、流控制訊息及通用命令和指示。
H.324終端內在每一個方向上僅有一個控制信道,它是使用H.245建議的訊息和進程來實現的。此控制信道將在邏輯信道0中傳輸。從數字通信建立開始至其結束,控制信道將一直是開放的,開放和關閉邏輯信道的正常程式將不要求控制信道進行應答。
通用命令和指示取自H.245建議的訊息組。此外其他的命令和指示信號將在特定的視頻、音頻或數據流的帶內進行傳輸。H.245的訊息可分為四類,即請求、應答、命令及指示。請求訊息要求接收端執行一個特定的動作,包括一個迅速的應答。應答訊息是對相應的請求作出應答。命令訊息要求一個特定的動作,但不要求應答。指示訊息只是一個信息而不要求任何動作或應答。H.324終端將按照H.245建議中的規定,應答所有H.245支持的命令和請求,並傳輸準確地反映終端狀態的指示。
H.324終端將能分析所有的H.245 Multimedia SystemControl PDU 訊息,並且將傳送並接收由終端所支持的需要實現的請求功能及其他可選功能的訊息。H.245建議的所有訊息及進程,除了明確說明是可選的或有關的終端不支持的可選能力之外,均是需要的。對於不能識別的請求、應答或命令訊息,H.324終端將送出FunctionNotSupported 的訊息進行應答。
控制信道指示 UserInputIndication 在從小鍵盤或大鍵盤輸入字母數字信息時是有效的,它等效於用在模擬電話中的DTMF 信號。它可用於手動操作遙控裝置,如語音信箱或視頻信箱系統,選單驅動的信息服務等。H.324終端支持某些用戶輸入字母的傳輸。其他字母的傳輸是可選的。
(4)能力交換(Capabilities Exchange)
能力交換服從H.245建議的進程,它不但分別提供終端傳送和接收的能力,而且提供了終端可以描述其同時運行在多種模式組合形式下工作能力的系統。
接收能力說明終端接收和處理到來的信息流的能力。由於接收端已發出其接收能力的指示(令),傳送端將限制它傳送信息的內容。若終端無接收能力,說明該終端僅能傳送而不能接收。
傳送能力說明終端傳送信息流的能力。傳送能力用來向接收端提供運行模式的選擇,使接收端可工作在其所要求的最佳化模式下。若沒有傳送能力說明終端不對接收端提供最佳化模式的選擇(但它仍可傳送接收端能力範圍內的任何信息)。
傳送終端用分配表Capability Table 中的號碼給每一種終端可能運行的各種模式分配一個號碼,例如G.723音頻、G.728音頻及CIF H.263視頻每一種均可分別被分配一個號碼。
這些能力編號組合成選擇能力集(Alternative CapabilitySet)結構。每一個AlternativeCapabilitySet 表明了終端能精確地運行在選擇能力集中所列模式中的一種,例如某個AlternativeCapabilitySet表列{G.711、G.723、G.728}表示終端能運行在這些音頻模式中的任何一種模式,但只能運行在一種模式下。
多個AlternativeCapabilitySet 的結構又組合成聯合能力(SimultaneousCapabilities)結構。每一個Simnltaneous Capabilities結構說明終端能同時運行的一組模式,例如一個SimultaneousCapabilities 結構包含兩個AlternativeCapabilitySet結構{H.261、H.263}及{G.711、G.723、G.728},說明終端能同時運行在視頻及音頻編解碼器的任意一種建議下。
終端的全部能力由一組能力說明符(Capability Descriptor)所描述,每一個能力說明符由一個單個SimultaneousCapabilities結構及一個CapabilityDescriptor Number(能力說明序號)所組成。
(5)邏輯信道信令(Logical Channel Signalling)
每一個邏輯信道從傳送端至接收端傳送信息,邏輯信道在傳輸的每一個方向上由惟一的邏輯信道序號進行標識。
邏輯信道的打開及關閉按H.245進程,使用(打開邏輯信道OpenLogicalChannel)及關閉邏輯信道(CloseLogicalchannel)訊息。當某邏輯信道打開時,OpenLogicalChannel訊息充分說明了邏輯信道的內容,包括媒體形式、套用算法、H.223適配層及其可選項、其他所有接收終端解釋邏輯信道內容所需要的信息。當不再需要時,邏輯信道可被關閉。若信源沒有信息送出,則打開邏輯信道將不起作用。
(6)模式優選
接收端可以要求傳送端按H.245 RequestMode 訊息傳送一個特殊的模式,若可能的話傳送端應滿足接收端的要求。
(7)復用器接口
控制信道是可分段的,並使用邏輯信道0。所有的H.324終端均支持在組幀的H.223適配層AL1上H.245控制訊息的傳輸,以保證可靠地進行誤碼幀的重傳。
(8)視頻信道
所有H.324終端均支持H.263及H.261視頻編解碼器的視頻通信。H.261及H.263視頻編解碼器在使用時不加BCH糾錯碼,也沒有糾錯幀。共有5種標準圖像格式,即16CIF、4CIF、CIF、QCIF及SQCIF。在H.261中定義了CIF及QCIF格式,在H.263中又定義了SQCIF、4CIF及16CIF格式。對於H.324終端的圖像格式在採用H.261視頻編解碼器時對SQCIF圖像仍編碼為QCIF格式,但實際顯示尺寸比QCIF小,在有效顯示圖像外用黑框線填充。所有這些格式的像素縱橫比均與CIF格式相同。
所有的視頻解碼器均能處理由H.223復用器來的最大視頻碼流(單路時為V.34碼率,雙路時為2×V.34碼率)。
所有提供視頻通信的H.324終端中的視頻編解碼器均支持採用H.223適配層AL3的可分段邏輯信道,採用至少為一個位元組的控制欄位。在編碼器中當最小的AL3傳送緩衝器尺寸(SendBufferSize)為1024Byte時,要求支持重傳功能。若視頻通信只支持單向傳輸(傳送或接收)時,即使在反向信道中沒有視頻信息傳送,H.223適配層AL3協定也支持反方向的傳輸。因為AL3協定要求一個反向的工作信道,採用AL3的雙向邏輯信道將使用H.245進程使之打開。
當H.223 AL3在檢測出誤碼時將允許視頻信息進行重傳,接收終端基於諸多因素,包括所測量的網路延遲、誤碼率、終端是否是多點會議的一個,是否與H.320終端互連及誤碼隱蔽技術的有效性等情況有可能不要求重傳。當視頻編解碼器從H.223 AL3 接收一個指令,即本地的AL3層不能滿足重傳要求,它將使用INTRA 編碼模式對下一幀圖像進行編碼。
其他的視頻編解碼器、適配層及可選項可以通過H.245 協商使用。
(9)音頻通道
提供音頻通信的所有H.324終端均支持G.723音頻編解碼器的高低兩種碼率工作。G.723將能接收無聲幀。採用哪種傳輸速率由傳送端決定,並通過音頻通道帶內信號通知接收端,並作為每一音頻幀的句法的一部分。傳送端可以一幀一幀地變換G.723的速率,也可以基於碼率、音頻質量或其他的優先考慮問題變換碼率。接收端可以通過H.245選擇一個優選的音頻碼率或模式。
H.263及H.261視頻編解碼器在處理信息時有一定的時間延遲,而G.723音頻編解碼器則延遲很小。為了保證唇同步(即聲像同步),就要求在音頻通道中加入一些延遲作為補償。
提供音頻通信的所有H.324終端採用H.223適配層AL2支持G.723編解碼器。通過H.245建議可以採用其他的適配層及可選項。
(10)數據通道
所有的數據通道均是可選的,下面幾種是可選的標準的數據套用。
① T.120系列點對點及多點聲像會議,包括資料庫訪問、靜止圖像傳輸及注釋、套用共享、實時檔案傳輸等。
② T.84(SPIFF)跨越套用層的點對點靜止圖像傳輸。
③ T.434跨越套用層的點對點遠程檔案傳輸。
④ H.224的各種實用套用控制,包括H.281遠端攝像機控制。
⑤ 網路鏈路層,按ISO/IEC TR9577協定(支持IP及PPP網路層)。
⑥ 來自外部數據口的未指定的用戶數據。
這些數據套用可能存在外部計算機中或通過V.24或等效的接口附加在H.324終端的有關設備中,也可能集成在H.324終端內。每一種數據套用均採用了鏈路層傳輸的有關數據協定。
由數據套用所採用的標準化的鏈路層數據協定包括:
① 無誤碼控制的異步字元傳輸用的緩衝V.14模式。
② 具有誤碼糾錯的異步字元傳輸用的LAPM/V.42協定,此外在套用層基礎上可能採用V.42bis數據壓縮協定。
③ 傳輸HDLC幀的HDLC幀通道協定。
④ 無幀或自組幀協定進行直接訪問的透明數據模式。
所有提供實時聲像會議的H.324終端應支持T.120協定集,所有的數據協定將在某邏輯通道內運行。通過H.245控制信道的協商在不同邏輯信道中同時可採用多個協定,或運行在多個數據信道。其他的數據協定及套用亦可通過H.245的協商使用。
圖2示出了數據套用及數據協定接口。在圖中數據協定置於H.324終端內部,通過V.24接口與外接計算機或其他有關的數據套用運行設備相連。提供各種數據協定的H.324終端支持採用分段邏輯信道的協定及在組幀及未組幀模式下工作的H.223適配層AL1。其他的ALs層在接收端通過H.245協商作出能力的指示後可以被採用。
4.終端進程 通信規範按以下步驟進行。
(1)語音頻寬信道的呼叫設定
呼叫終端將按照模擬電話的步驟請求連通,當呼叫由一個外接Modem的終端開始時,將採用V.25 ter建議的步驟,在呼叫設定完成後,就進入步驟(2)。
當採用V.8協定進程時,跳過步驟(2),直接進入步驟(3)。當採用V.8bis協定進程時,就進入步驟(2)。
(2)模擬電話通信初始化
這一步驟是通常的模擬電話語音模式,在此模式工作時,用戶可在進入多媒體電話工作之前進行通話。在這一步驟時,終端會採用V.8bis建議所定義的進程交換工作模式能力信息,並轉至步驟(3)工作。
(3)數字通信的建立
若V.8啟動程式檢測到V.34 Modem,Modem就進行連結,當Modem連結程式完成及數字通信建立,則進入步驟(4)。
(4)初始化
數字通信建立後,為保證同步16 HDLC標識將被傳輸,接著採用H.245控制信道使系統之間通信初始化。
(5)通信
按照H.245建議所定義的要求,將改變邏輯信道的屬性、能力、接收模式等。
(6)通信的結束
任意一個終端均可開始結束通信。終端初始化將遵循一定的步驟,相繼停止傳送視頻、數據及音頻,並關閉相應的邏輯信道。
(7)補充服務及呼叫清除。
5.與其他終端的互動工作 H.324終端可與其他終端互動工作。
① H.324可視電話終端支持與僅有語音通話能力的模擬電話互動工作,此時H.324終端作為一部普通的模擬電話機工作。
② H.324可視電話可與在ISDN網上的H.320多媒體可視電話終端互連工作。此時還必須安裝ISDN互連工作適配器或採用在ISDN網上工作的ISDN及GSTN雙模式終端。
一個H.324/H.320互動工作適配卡放置在ISDN及GSTN信號的接口上。它可以實現H.223及H.221復用器之間的碼型轉換,亦可實現H.324及H.320協定中控制信息內容、音頻及數據邏輯信道的相互轉換。
為了在H.324及H.320終端間通過互動工作適配器進行通信,支持視頻通信的H.324終端將支持H.261視頻編解碼器在QCIF圖像格式下工作,使得在視頻碼流轉換時避免附加的延遲。當運行在這一模式時,互動工作適配器可以使每一個終端類型工作在插入或消除H.261 BCH誤碼校正及幀誤碼校正的狀態。H.324終端將回響H.245 FlowControlCommand命令,以使得在傳輸中的H.324視頻數據流和在使用中通過H.221復用的H.320視頻碼流相匹配。
雙模式(H.320及H.324)終端在ISDN網上傳輸時,將採用“虛擬Modem”傳送H.324的GSTN信號,此“虛擬的Modem”將產生和接收在ISDN網上傳輸的被編碼成G.711音頻碼流的V.34模擬信號。
③ H.324終端可與在無線行動電話網(H.324/M)上傳輸的多媒體電話終端互動工作,人們希望多媒體電話終端亦能套用在無線行動電話網上。這一終端將滿足H.324/M建議的要求。無線終端與GSTN終端可以採用H.245的FlowControlCommand命令進行碼率匹配。
6.H.324終端的多點工作 如圖3所示,H.324終端可以通過多點控制單元MCU 的連線運行在多點結構的模式下。MCU 將傳送一個列出所希望的傳輸模式的接收能力集給終端,以使各終端設定成一個特殊的傳輸公用模式。因為在多點結構中每一個Modem都可能運行在不同的速率下,MCU 將傳送H.245的FlowControlCommand訊息去限制它們的傳送速率,以使得送到各接收端的信息達到多點碼率的匹配。在多點結構中,每一個終端將傳送一個與視頻及音頻信道有關的不同的H.223 SkewIndication 時差訊息。為了保證在接收端的唇同步(音頻同步),MCU將傳送一個精確的H.223 SkewIndication 訊息,MCU將通過這一訊息加上一個延遲來均衡所有的傳輸終端的視音頻時差,當播發終端進行切換時將傳送一個新的反映當前播發終端的音視頻時差的H.223 SkewIndication訊息。