隔行掃描

隔行掃描

隔行掃描(也稱為交錯)是一種對點陣圖圖像進行編碼的方法通過掃描或顯示每行或每行像素在電子顯示屏上“繪製”視頻圖像(另一種是逐行掃描)的兩種常用方法之一。

它是一種在不消耗額外頻寬的情況下將視頻顯示的感知幀速率加倍的技術。隔行掃描信號包含在兩個不同時間捕獲的視頻幀的兩個。這增強了觀看者的運動感知,並通過利用phi現象減少了閃爍

此技術使用兩個欄位來創建框架。一個欄位包含圖像中的所有奇數行;另一個包含所有偶數行。

基本介紹

  • 中文名:隔行掃描
  • 外文名:Interlace Scanning (簡寫i)
  • 套用:顯示設備(如電視機)
  • 領域:信息科學
說明,原理,編碼方法,目的,標識,好處,歷史,掃描區別,視頻檔案,交錯視頻,2:2下拉,2:3下拉,其他下拉模式,反交錯,場組合去隔行,場擴展去隔行,動作檢測,

說明

原理

隔行掃描(Interlaced)是在顯示設備表示運動圖像的方法,每一幀被分割為奇偶兩場圖像交替顯示,隔行掃描是一種減小數據量保證幀率的壓縮方法。
隔行掃描
電視標準制訂者考慮到交流電頻率50或60Hz,所以確定了25或30fps的幀率(Frame rate),我國電視台標準為(PAL)制,指畫面掃描50每秒(每幀掃描2場畫面,共25個奇場25個偶場)。兩組25個欄位一起工作,每1/25秒(或每秒25)創建一個完整的,兩場圖像構成一幀畫面可以使頻寬減小大約一半,但隔行掃描每1/50秒創建一個新的半幀(或每秒50個) 。另外隔行掃描信號中的偽像不能完全消除,導致幀之間會丟失一點信息。

編碼方法

隔行掃描編碼分兩種:
1、宏塊自適應幀場(MBAFF)編碼
隔行掃描
允許使用宏塊對結構編碼為幀的圖像,可以將一個幀宏塊劃分為兩個場宏塊進行編碼;
2、圖像自適應幀場編碼(PAFF或PicAFF)
允許自由選擇的圖像混合編碼為完整幀,將兩場合併為一幀進行編碼,或者將兩場分別編碼。
當圖像同時存在運動區域和非運動區域時,由於PAFF自適應技術粒度太粗,無法實現滿足更加精細的編碼要求,於是在H.264MPEG-4第10部分高級視頻編碼MPEG-4 AVC))便引出了宏塊自適應幀場(MBAFF)編碼技術。
MBAFF對幀/場編碼的選擇是基於宏塊的,其將兩場合併為一幀進行編碼,但將每一個幀宏塊(16x16)劃分為場宏塊對(8*16),針對每一個幀宏塊,編碼器自動比較幀編碼和場編碼產生的碼流大小,然後使用最節省碼流的方式,並且可以避免產生偽像

目的

如果模擬廣播電視系統採用25或30幀逐行掃描掃描方式顯示,當電子束從螢幕的上半部分移到下半部時,螢幕上半部分的亮度就有了可以觀察到的衰減,於是畫面下半部分顯得更亮。這只是一個瞬間,事實上最亮的部分(當然就是電子束剛經過的區域)會不斷移動,從而產生閃爍現象。為防止閃爍,最佳的辦法是加倍刷新率,改成60p掃描,將每幅畫面掃描2次,因為在60分之一秒內,人眼能感覺到的亮度衰減就很小了。可是這樣做,單位時間內掃描的總行數會加倍,那么水平掃描的速度就要加快。如此一來技術要求就會過高,以當時的條件做不到。於是標準制訂者想到了一個折衷的辦法,先花60分之一秒掃描奇數行(上場),然後再用後60分之一秒掃描偶數行(下場),兩者互補成完整的畫面。雖然掃描下場時,上場的亮度衰減了,但是由於亮暗的部分交織在一起,反而不易察覺。
隔行掃描
隔行掃描
使用隔行掃描可以讓每秒可以顯示更多的幀,每幀顯示更多圖像,使頻寬減少,隔行掃描提供完整的垂直細節,具有逐行掃描所需的相同頻寬,但具有兩倍的感知幀速率刷新率。與非隔行掃描的鏡頭(幀速率等於場速率)相比,這有效地使時間解析度(也稱為時間解析度)加倍。
無論是逐行掃描還是隔行掃描,都有視頻檔案、傳輸和顯像三個概念,這三個概念相通但不相同。最早出現的是隔行掃描顯像,同時就配套產生了隔行傳輸,而隔行掃視頻檔案是到數字視頻時代才出現的,其目的是為了兼容原有的隔行掃描體系(隔行掃描就是還依然在廣泛套用)。

標識

格式標識符(如576i 50和720p 50)指定逐行掃描格式的幀速率,但對於隔行掃描格式,它們通常指定欄位速率(幀速率的兩倍)。這可能會導致混淆,因為行業標準的SMPTE時間碼格式總是處理幀速率,而不是幀速率。為避免混淆,SMPTE和EBU總是使用幀速率來指定隔行格式,例如,480i 60是480i / 30,576i 50是576i / 25,1080i 50是1080i / 25。該慣例假設隔行掃描信號中的一個完整幀依次由兩個場組成。

好處

螢幕截圖,展示了去隔行掃描和隔行掃描圖像之間的區別。
隔行掃描
模擬電視中最重要的因素之一是信號頻寬,以兆赫為單位。頻寬越大,整個生產和廣播鏈越昂貴,越複雜。這包括攝像機,存儲系統,廣播系統和接收系統:地面,有線,衛星,網際網路和最終用戶顯示器(電視和計算機監視器)。
對於固定頻寬,隔行掃描為給定行數提供了兩倍顯示刷新率的視頻信號(與逐行掃描相比)視頻以類似的幀速率 - 例如1080i,每秒60幀半幀,而1080p每秒30幀全幀)。較高的刷新率改善了運動中物體的外觀,因為它更頻繁地更新其在顯示器上的位置,並且當物體靜止時,人類視覺組合來自多個相似半幀的信息以產生與所提供的相同的感知解析度。通過漸進的全幀。如果源材料具有更高的刷新率,則此技術僅有用。電影電影通常以24fps記錄,因此不會受益於隔行掃描,這種解決方案可將最大視頻頻寬降低到5MHz而不會降低60Hz的有效圖像掃描速率。
給定固定頻寬和高刷新率,隔行掃描視頻還可以提供比逐行掃描更高的空間解析度。例如,具有60 Hz場頻的1920×1080像素解析度隔行掃描HDTV(稱為1080i60或1080i / 30)具有與具有60 Hz幀速率(720p60或720p / 60)的1280×720像素逐行掃描HDTV類似的頻寬。 ,但是對於低運動場景,空間解析度大約是其兩倍。
但是,頻寬優勢僅適用於模擬或未壓縮的數字視頻信號。對於所有當前數位電視標準中使用的數字視頻壓縮,隔行掃描引入了額外的低效率。。EBU已經進行了測試,表明隔行掃描視頻相對於逐行掃描視頻的頻寬節省最小,即使幀速率提高了兩倍。即,1080p50信號產生與1080i50(又名1080i / 25)信號大致相同的比特率,和1080p50實際上需要較少的頻寬,以便在編碼“運動”時主觀上比1080i / 25(1080i50)等效更好。輸入“場景。
VHS以及使用旋轉鼓在錄像帶上錄製視頻的大多數其他模擬視頻錄製方法都受益於隔行掃描。在VHS上,鼓每幀轉動一整圈,並帶有兩個圖像頭,每個圖像頭在每次旋轉時掃描一次磁帶表面。如果設備用於記錄逐行掃描視頻,則磁頭的切換將落在圖像的中間並顯示為水平頻帶。隔行掃描允許切換髮生在圖像的頂部和底部,標準電視機中的區域對於觀看者是不可見的。該設備也可以比每次掃描記錄全幀時更緊湊,因為這需要雙倍直徑的鼓以角速度的一半旋轉,並在磁帶上進行更長,更淺的掃描以補償每次掃描的雙倍線數。然而,相同的圖像區域,基本上將垂直解析度減半,直到播放進行。另一種選擇是在實際停止磁帶之前按下暫停按鈕捕獲一個完整的幀(兩個欄位),然後從幀緩衝區重複再現它。後一種方法可以產生更清晰的圖像,但是通常需要一定程度的去隔行以獲得顯著的視覺效果。雖然前一種方法會產生朝向圖像頂部和底部的水平偽影,因為磁頭不能沿著磁帶表面精確地穿過與在移動磁帶上記錄時完全相同的路徑,但這種不對準實際上會隨著逐行記錄而變差。
隔行掃描可用於製作3D電視節目,特別是對於CRT顯示器,尤其是對於彩色濾光眼鏡,通過在交替場中傳輸每隻眼睛的彩色鍵控圖像。這不需要對現有設備進行重大改動。快門眼鏡也可以採用,顯然需要實現同步。如果使用逐行掃描顯示來查看這種編程,則任何對圖像進行去隔行掃描的嘗試都會使效果無效。對於彩色濾光眼鏡,圖像必須是緩衝的並且顯示為具有交替的彩色鍵控線的漸進式,或者每個場必須被線性加倍並顯示為離散幀。後一種程式是在逐行顯示器上適合快門眼鏡的一種方法。

歷史

歷程
當開發電影膠片時,必須以高速率照亮電影螢幕以防止可見的閃爍。所需的確切速率因亮度而異 - 在昏暗的房間內可接受40 Hz,而對於延伸到周邊視覺的明亮顯示器,可能需要高達80 Hz。膠片解決方案是使用三葉片快門將每幀膠片投影三次:以每秒16幀的速度拍攝的電影每秒照亮螢幕48次。之後,當聲膜變得可用時,每秒24幀的更高投影速度使得雙葉片快門能夠產生每秒48次的照明 - 但僅限於投影儀無法以較低的速度投射。
此解決方案不能用於電視。要存儲完整的視頻幀並將其顯示兩次,需要幀緩衝器 -電子存儲器(RAM) - 足以存儲視頻幀。直到20世紀80年代後期,這種方法才變得可行。此外,避免工作室照明引起的螢幕干擾模式和真空管技術的限制要求以交流線路頻率掃描電視的CRT。(這在美國是60赫茲,50赫茲歐洲。)
在機械電視領域,LéonTheremin展示了隔行掃描的概念。他一直在開發一種基於鏡鼓的電視,從1925年的16行解析度開始,然後是32行,最後在1926年使用隔行掃描64。作為他的論文的一部分,他在1926年5月7日電傳輸並投射近同步在五英尺見方的螢幕上移動圖像。
1930年,德國Telefunken工程師FritzSchröter首先制定了將單個視頻幀分解為隔行掃描線的概念並申請了專利。在美國,RCA工程師Randall C. Ballard在1932年獲得了同樣的想法。商業實施始於1934年,因為陰極射線管螢幕變得更亮,增加了由漸進(順序)引起的閃爍水平掃描。
1936年,當英國制定模擬標準時,CRT只能在1/50秒內掃描大約200行。使用交錯,可以疊加一對202.5線場,以成為更清晰的405線框。垂直掃描頻率保持50 Hz,但可見細節明顯改善。結果,該系統取代了當時也使用的John Logie Baird的240線機械逐行掃描系統。
從20世紀40年代開始,技術的進步使得美國和歐洲其他國家採用逐漸增加頻寬的系統來掃描更高的線數,並獲得更好的圖像。然而,隔行掃描的基本原理是所有這些系統的核心。美國採用稱為NTSC的525線路系統,歐洲採用625線路系統,英國從405線路系統切換到625線路,以避免開發獨特的彩色電視方法。法國從其獨特的819系統切換到625的更歐洲標準。雖然術語PAL通常用於描述電視系統的線路和幀標準,這實際上是不正確的,並且僅指在標準625線路廣播上疊加顏色信息的方法。法國採用了他們自己的SECAM系統,其他一些國家也採用了該系統,特別是俄羅斯及其衛星。PAL已被用於其他一些NTSC廣播,特別是在巴西。
直到20世紀70年代,當計算機監視器的需求導致重新引入逐行掃描時,隔行掃描無處不在。Interlace仍然用於大多數標準清晰度電視和1080iHDTV廣播標準,但不適用於LCD,微鏡(DLP)或大多數等離子顯示器;這些顯示器不使用光柵掃描來創建圖像,因此不能從隔行掃描中受益:實際上,它們必須用逐行掃描信號驅動。在去隔行從正常的隔行廣播電視信號獲得逐行掃描的電路可能增加使用這種顯示器的電視機的成本。當前漸進式顯示器在HDTV市場中占主導地位。
計算機為何不使用隔行掃描
在20世紀70年代,計算機和家庭視頻遊戲系統開始使用電視機作為顯示設備。此時,480線NTSC信號遠遠超出低成本計算機的圖形處理能力,因此這些系統使用簡化的視頻信號,使每個視頻場直接掃描在前一個視頻上,而不是兩條線之間的每條線。以前的欄位。這標誌著自20世紀20年代以來從未見過的逐步掃描的回歸。由於每場成了自己的,現代術語一個完整的框架將調用此240P的NTSC套,以及288P的PAL。雖然允許消費者設備創建此類信號,但廣播法規禁止電視台像這樣傳輸視頻。諸如CGA的計算機監視器標準進一步簡化為NTSC,其通過省略顏色調製來改善圖像質量,並允許計算機的圖形系統和CRT之間的更直接連線。
到20世紀80年代中期,計算機已超出這些視頻系統並需要更好的顯示器。的蘋果IIGS從使用舊的掃描方法的遭遇,具有最高的顯示解析度為640X200,產生嚴重失真的高窄像素形狀,使得現實勻稱圖像的顯示困難。各公司的解決方案差異很大。由於PC監視器信號不需要廣播,因此它們消耗的頻寬遠遠超過NTSC和PAL信號所限制的6,7和8MHz頻寬。IBM的單色顯示適配器和增強型圖形適配器以及Hercules圖形卡和原始Macintosh計算機生成的視頻信號接近350p。所述準將Amiga的創建真正的隔行480i30 / 576i25RGB信號,適合於NTSC / PAL編碼。這種能力導致Amiga在視頻製作領域占主導地位直到20世紀90年代中期,但隔行掃描顯示模式導致需要單像素細節的更傳統PC套用的閃爍問題。1987年引入了VGA,很快就將PC標準化了,幾年後蘋果公司只推出了Mac標準,當VGA標準進行了改進,以匹配1987年推出的Apple專有的24位彩色視頻標準。
在20世紀80年代末和90年代初期,顯示器和顯示卡製造商推出了新的高解析度標準,再次包括隔行掃描。這些監視器以非常高的刷新率運行,意圖這將減輕閃爍問題。這種監視器非常不受歡迎。雖然起初閃爍並不明顯,但眼睛疲勞和缺乏焦點仍然是一個嚴重的問題。該行業很快就放棄了這種做法,在過去十年的剩餘時間裡,所有監督者都保證他們所聲明的決議是“非交錯的”。這種經驗就是為什麼至二十一世紀PC行業仍然反對高畫質電視的交錯,並遊說720p標準。此外,業界正在遊說超過720p,實際上是NTSC傳統國家的1080 / 60p,以及PAL傳統國家的1080 / 50p。

掃描區別

每一幀圖像由電子束順序地一行接著一行連續掃描而成,這種掃描方式稱為逐行掃描。把每一幀圖像通過兩場掃描完成則是隔行掃描,兩場掃描中,第一場(奇數場)只掃描奇數行,依次掃描1、3、5…行,而第二場(偶數場)只掃描偶數行,依次掃描2、4、6…行。隔行掃描技術在傳送信號頻寬不夠的情況下起了很大作用,逐行掃描和隔行掃描的顯示效果主要區別在穩定性上面,隔行掃描的行間閃爍比較明顯,逐行掃描克服了隔行掃描的缺點,畫面平滑自然無閃爍。在電視的標準顯示模式中,i表示隔行掃描,p表示逐行掃描
說隔行顯示不如逐行,這又是為什麼?這就要看這兩種模式在顯像時的具體過程。
我們有一部30p的視頻用作測試。假設有一台高速攝影機,對著平板電視拍攝(CRT存在掃描過程,解釋起來稍微有些複雜,所以以平板電視為例)。接著我們用慢鏡頭重新觀看電視機的工作狀況,就會看到下列景象。
1080p:每秒顯示30個畫面(實際上是60個場,由於第一個1/60秒和第二個1/60秒內顯示的畫面是一樣的,所以看不到區別)。
1080i:
(每秒顯示60個場,我們用“第一場”、“第二場”、“第三場”等表示在第一個、第二個、第三個1/60秒內發生的事。)
如圖:
隔行掃描
第一場:顯示上場的畫面,下場還沒出來,所以是空的
隔行掃描
第二場:下場顯示出來了,而上場依然存在,所以我們看到了一張完整的畫面。
隔行掃描
第三場:上場刷新成第2幀的內容,而下場沒動
隔行掃描
第四場:下場跟進刷新,於是我們就看到完整的第2幀了
隔行掃描
第五場:上場變成了第3幀,而下場仍然還是第2幀中的內容
隔行掃描
第六場:下場繼續跟進,我們又看到了完整的第3幀
……
可以看到1080p和1080i在顯示上根本的不同了。由於單位時間內總會有一半時間看到交錯的畫面,所1080i的顯示會略有模糊。

視頻檔案

攝像機的采像,從一開始其實不存在掃描,因為無論是膠片還是電子原件都是同時受光的。但是,要讀取感光器上的信息(其核心任務將畫面採樣為YUV/RGB電信號),還是要靠掃描,於是讀取每個像素的順序就必須考慮。可以採取按順序依次讀取(逐行方式),也可以每行按順序讀取,但是先讀完所有奇數行再讀偶數行(隔行方式)。為了兼容電視機的隔行掃描體系,過帶機(將膠片上的畫面採樣為YUV/RGB電信號並保存在磁帶上的機器)和有些攝像機是隔行掃描制式的。當然也有逐行制式的產品。
當人們學會用電子原件感光和用數位化的計算機檔案保存視頻時,數字攝像機就實用化了。事實上用數字信息保存的依然是YUV/RGB電信號,只是變換了個介質,本質上沒什麼區別(這裡指的是未壓縮的視頻,經過壓縮後就大不一樣了)。
但在計算機中,不管接到的是逐行還是隔行信號,都會按順序逐一寫入檔案,不特別區分。如此一來,計算機上的視頻,以逐行和隔行信號為訊源的檔案肯定有區別,它們分別稱為逐行掃描和隔行掃描視頻。

交錯視頻

隨著全球流行的廣播電視的出現,製片人意識到他們需要的不僅僅是電視直播節目。便轉向電影、電視劇、新聞、短視頻等原創材料回放,然而低幀率視頻檔案對於高幀率回放設備之間的幀速率刷新率)差異意味著簡單地將電影播放到電視攝像機中會閃爍。因此需要進行一些插幀或幀複製讓場同步(垂直同步),但是如果錄製的視頻檔案幀率高於回放設備,只需要丟幀到廣播電視標準即可。
通常通過使用平滑(插值算法)而不是幀複製算法(例如3:2下拉等)來實現最佳結果,以調整電影和視頻幀速率之間的速度差異。
使用垂直同步防止螢幕撕裂時會出現類似問題,這是幀速率不匹配時遇到的另一個問題。

2:2下拉

在使用PALSECAM視頻標準的國家,用於電視的電影以每秒25幀的速度拍攝。PAL視頻標準以每秒25幀的速度播放,因此從電影到視頻的轉換很簡單;對於每個電影幀,捕獲一個視頻幀。
最初以24幀/秒拍攝的戲劇特徵以25幀/秒顯示。雖然在圖片中通常沒有注意到這一點(但是在動作速度期間可能會更加明顯,特別是如果拍攝的片段被拍下來),播放速度增加4%會導致音頻音調稍微明顯增加,僅超過0.679半音,這是有時使用音高變換器進行校正,儘管音高變換是最近的創新並取代了25幀/秒格式的替代電視電影方法。
2:2 pulldown也用於轉移節目和電影,以每秒30幀的速度拍攝,就像FriendsOklahoma!(1955年電影)NTSC視頻,其具有60Hz的掃描速率。
雖然從PAL和SECAM電視的早期開始,4%的速度增加已經成為標準,但最近新技術已經普及,並且所得到的電視節目的速度和音調與原始電影的相同。
這種下拉方法有時用於將24幀/秒的材料轉換為25幀/秒。通常,這涉及到沒有上述4%加速的膠片到PAL傳輸。對於24幀/秒的電影,每25幀PAL視頻有24幀膠片。為了適應幀速率的這種不匹配,必須在50個PAL場上分配24幀膠片。這可以通過每12幀插入一個下拉場來實現,從而有效地在PAL視頻的25個場(或“12.5幀”)上傳播12幀膠片。使用的方法是2:2:2:2:2:2:2:2:2:2:2:3(歐元)下拉(見下文)。
這種方法源於對更快,更高音調的音軌的挫敗感,這些音軌傳統上伴隨著傳輸給PAL和SECAM觀眾的電影。一些電影開始以這種方式電視電影。它特別適用於配樂特別重要的電影。
當NTSC區域中的電視台播放使用PAL列印/版本但正在以NTSC格式廣播的電影或節目時,有時它們不執行適當的PAL到NTSC下拉轉換,或者它不正確地完成。由於PAL 576線路/ 50 Hz與NTSC 480線路/ 60 Hz格式的速率更快,因此程式會略微加速和/或聲音更高音調。
一些DVD版本的電視節目/電影,如The Archie Show,其劇集以NTSC格式播出,但大師們在使用時丟失或損壞,使用PAL 576/50列印,3:2下拉尚未播出正確執行,導致更快的膠片速度和更高的音高。雖然幾集中的一些場景使用NTSC鏡頭,因為PAL母版丟失,並且鏡頭在使用中受損,導致速度,音高和膠片質量的變化。

2:3下拉

在美國和其他電視使用59.94 Hz垂直掃描頻率的國家,視頻以29.97幀/秒的速度播出。為了在視頻信號上精確地呈現電影的運動,電視電影必須使用稱為2:3下拉的技術,也稱為3:2下拉,以從24轉換為29.97幀/秒。
術語“下拉”來自在傳送機構的薄膜部分內向下“拉動”(物理移動)薄膜的機械過程,以重複的速率(標稱為24幀/秒)將薄膜從一幀推進到下一幀。 。這分兩步完成。第一步是將膠片運動減慢1/1000至23.976幀/秒。觀察者察覺不到速度的差異。對於一部兩小時的電影,播放時間延長了7.2秒。
2:3下拉的第二步是將電影幀分配到視頻場中。在23.976幀/秒時,每5幀29.97幀/秒視頻有4幀膠片:
23.97/29.97=5/4
通過利用60Hz視頻的隔行特性,這四個幀被“拉伸”為五個。對於每一幀,實際上存在兩個不完整的圖像或,一個用於圖像的奇數行,一個用於偶數行。有,因此,對於每四個膠片幀,這是所謂的十個欄位Ç,和d。電視電影交替地將A幀放置在兩個場中,B幀跨越三個場,C幀跨越兩個場,D幀跨越三個場。這可以寫成AABBBCCDDD或2-3-2-3或簡單地2-3。在四個膠片幀曝光後,循環完全重複:
隔行掃描
3:2模式與上面所示模式相同,只是它移動了一幀。例如,以膠片幀B開始的循環產生3:2模式:BBBCCDDDAA或3-2-3-2或簡單地3-2。換句話說,2-3和3-2模式之間沒有區別。實際上,“3-2”符號具有誤導性,因為根據SMPTE標準,每個四幀電影序列的第一幀被掃描兩次,而不是三次。
上述方法是“經典”2:3,它在幀緩衝區允許保持多於一幀之前使用。執行2:3的首選方法每五個中只創建一個髒幀(即3:3:2:2或2:3:3:2或2:2:3:3);雖然這種方法有更多的抖動,但它允許更容易的上轉換(丟棄髒幀而不丟失信息)和編碼時更好的整體壓縮。松下DVX-100B攝像機支持2:3:3:2模式,名稱為“Advanced Pulldown”。請注意,只顯示欄位 - 沒有幀,因此沒有偽幀 - 在隔行顯示中,例如在CRT上。在顯示隔行掃描視頻的其他方法中可能出現偽幀。

其他下拉模式

對於以低於24幀/秒的“靜音速度”拍攝的電影必須使用類似的技術,其中包括家庭電影格式(標準8毫米膠片的標準是16 fps,以及Super 8 mm膠片的18 fps)以及無聲電影(35毫米格式通常為16 fps,12 fps,甚至更低)。
  • 16幀/秒(實際為15.985)到NTSC 30幀/秒(實際為29.97):下拉應為3:4:4:4
  • 16幀/秒到PAL 25:下拉應為3:3:3:3:3:3:3:4(更好的選擇是以16.67幀/秒的速度運行電影,將下拉簡化為3:3)
  • 18幀/秒(實際為17.982)到NTSC 30:下拉應為3:3:4
  • 20幀/秒(實際為19.980)到NTSC 30:下拉應為3:3
  • 27.5幀/秒到NTSC 30:下拉應為3:2:2:2:2
  • 27.5幀/秒到PAL 25:下拉應為1:2:2:2:2
此外,已經描述了其他模式,其涉及在逐行顯示器(例如,LCD或電漿)上顯示24幀/秒視頻(例如,來自DVD播放器)所需的逐行幀速率轉換:
  • 24幀/秒至96幀/秒(4倍幀重複):下拉為4:4
  • 24幀/秒至120幀/秒(5倍幀重複):下拉為5:5
  • 24幀/秒到120幀/秒(3:2下拉,然後是2倍去隔行):下拉是6:4

反交錯

有交錯就有反交錯。並非所有隔行掃描視頻都要進行反交錯處理,只有那些存在交錯的視頻才需要這么做。
有幾種去隔行掃描方法。

場組合去隔行

  • 編織Weave通過將連續的欄位添加在一起來完成編織。當圖像在欄位之間沒有改變時,這很好,但是當一幀中的像素與另一幀中的像素不對齊,形成鋸齒狀邊緣時,任何改變都將導致稱為“梳理”的偽像。該技術以時間解析度(運動)的一半為代價保留了完整的垂直解析度。
  • 混合(Blending)是通過完成共混,或平均連續的場被顯示為一幀。避免梳理,因為圖像在彼此之上。這樣就會留下一種稱為鬼影的偽像。圖像失去垂直解析度和時間解析度。這通常與垂直調整大小相結合,因此輸出在垂直解析度上沒有數值損失。這樣做的問題在於存在質量損失,因為圖像已經縮小然後增大。這種細節損失使圖像看起來更柔和。由於兩個運動場組合成一個幀,因此混合也會丟失一半的時間解析度。
  • 選擇性混合(Selective blending),或智慧型混合運動自適應混合,是編織和混合的組合。由於幀之間沒有變化的區域不需要任何處理,所以框架是編織的,只有需要它的區域被混合。這保留了完整的垂直解析度和一半的時間解析度,並且由於兩種技術的選擇性組合,它具有比編織或混合更少的偽像。
  • 反向電視電影(IVTC、Inverse Telecine):電視電影用於將運動圖像源以每秒24幀的速度轉換為使用NTSC視頻系統,每秒30幀的隔行掃描電視視頻。以每秒25幀的速度使用PAL的國家不使用電視電影,因為運動圖像源加速4%以達到每秒所需的25幀。如果使用Telecine,則可以反轉算法以獲得具有較慢幀速率的原始非隔行掃描素材。為了使其工作,必須知道或猜測確切的電視電影模式。與大多數其他去隔行方法不同,當它工作時,反轉電視電影可以恢復原始的逐行掃描視頻流。
  • Telecide風格的算法:如果隔行掃描的鏡頭是以較慢的幀速率(例如“卡通下拉”)從漸進幀生成的,則可以通過從匹配的上一幀/下一幀複製丟失的場來恢復精確的原始幀。在沒有匹配的情況下(例如,具有提升的幀速率的簡短卡通序列),則濾波器回退到另一種去隔行方法,例如混合或行加倍。這意味著Telecide的最壞情況是偶爾出現重影或降低解析度的幀。相比之下,當更複雜的運動檢測算法失敗時,它們可能會引入對原始材料不忠的像素偽像。對於電視電影視頻,抽取可以作為後處理套用以降低幀速率,並且這種組合通常比簡單的反轉電視電影更穩健,當不同的隔行掃描的素材被拼接在一起時,它會失敗。

場擴展去隔行

    半尺寸顯示每個隔行掃描場本身,導致視頻的原始垂直解析度的一半,未縮放。雖然這種方法保留了所有垂直解析度和所有時間解析度,但由於其假長寬比,因此可以理解地不用於常規觀看。然而,它可以成功地用於套用期望非交錯幀的視頻濾波器,例如利用來自相鄰像素的信息的那些(例如,銳化)。
    線加倍
    線加倍取每個交錯場的線(僅由偶數或奇數線組成)並使它們加倍,填充整個幀。這導致視頻具有與場速率相同的幀速率,但是每個幀具有垂直解析度的一半,或者解析度等於構成幀的每個場的解析度。線倍增可防止梳狀偽影,但會導致圖像質量明顯降低,因為顯示的每幀都加倍,實際上僅在原始半場解析度下。這在靜止物體上很明顯,因為它們看起來像是上下擺動。這些技術也稱為bob去隔行線性去隔行出於這樣的原因。線倍增保留了水平和時間解析度,但犧牲了垂直解析度和靜止和較慢移動物體上的浮雕偽影。該方法的變體丟棄每幀中的一個場,使時間解析度減半。
    線加倍有時與一般的去隔行或插值(圖像縮放)相混淆,插值使用空間濾波來產生額外的線,從而降低像素化在任何類型的顯示器上的可見性。術語“line doubler”在高端消費電子產品中使用得更頻繁,而“去隔行”則更頻繁地用於計算機和數字視頻領域。

    動作檢測

    通過結合傳統的場組合方法(編織和混合)和幀擴展方法(bob或線加倍)來創建高質量的逐行視頻序列,可以確保最佳圖像質量;最好的算法也會嘗試預測後續子場之間的圖像運動的方向和數量,以便更好地將兩個子場混合在一起。
    方向和運動量的基本提示之一是隔行掃描信號中的梳狀偽像的方向和長度。更高級的實現將採用類似於視頻壓縮中使用的塊運動補償的算法;使用這種技術的去隔行掃瞄器通常更優越,因為它們可以使用來自許多領域的信息,而不是僅僅一兩個。這需要強大的硬體來實現實時操作。
    例如,如果兩個欄位的人臉朝左移動,則編織將創建梳理,並且混合會產生重影。高級運動補償(理想情況下)會看到幾個場中的臉部是相同的圖像,只是移動到不同的位置,並試圖檢測這種運動的方向和數量。然後,算法將嘗試通過將圖像組合在一起來重建兩個輸出幀中的面部的全部細節,沿著檢測到的方向移動每個子場的部分移動檢測到的移動量。
    運動補償需要與場景變化檢測相結合,否則它將嘗試在兩個完全不同的場景之間找到運動。實現不良的運動補償算法會干擾自然運動並且可能導致視覺偽像,其表現為應該是靜止或平滑運動圖像的“跳躍”部分。

    相關詞條

    熱門詞條

    聯絡我們