IVA(音視頻識別領域技術術語)

IVA(音視頻識別領域技術術語)

本詞條是多義詞,共2個義項
更多義項 ▼ 收起列表 ▲

IVA是In Video Action技術的縮寫,IVA目前與Google Voice的字幕自動化生成技術、百度Video In視頻無痕植入技術並稱改變視頻行業的三大革命性技術。

基本介紹

  • 中文名:IVA
  • 外文名:In Video Action
  • 行業:音視頻技術
基本簡介,技術解析,技術分級,技術前景,

基本簡介

IVA是In Video Action技術的縮寫,IVA目前與Google Voice的字幕自動化生成技術、百度Video In視頻無痕植入技術並稱改變視頻行業的三大革命性技術。
隨著觸屏時代的到來,交流平台的移動化、社交化、智慧型化已成為必然的發展方向。在這樣的趨勢下,視頻互動成為視頻行業制定戰略的重要考慮因素。

技術解析

IVA技術簡單來說是一種音視頻識別技術,加上一套互動工具所構成的互動體系。識別技術就像一個探頭,能夠尋找視頻中撥動心弦(或人為設定)的時刻,並用互動技術實現與觀眾的互動共鳴。值得一提的是,IVA技術可將直播視頻畫面中的人物、物體、品牌、紋理、場景甚至情緒等信息分揀出來,再通過各種互動工具與客群進行雙向交流。

技術分級

IVA的使命分三個層次,初級IVA、中級IVA、高級IVA。
其中,初級IVA是依據音視頻樣本庫標記視頻流中與樣本庫匹配的視頻片斷,比如從視頻流中識別廣告時段和廣告主、識別新聞聯播等節目的片頭、根據錄音識別用戶正在觀看的節目等。
中級IVA利用圖像處理技術、大數據技術和深度學習技術,識別視頻流中的場景、形狀、紋理和人物等。中級IVA可以從視頻流中識別大海、森林、鬧市等多達200多種場景,在場景連續出現超過30幀的情況下,識別率可以高達90%以上;形狀識別的典型案例是從視頻流中準確識別1000多種飲料瓶的品牌、容積;衣物、布料的質地和品牌識別屬於紋理識別的範疇;人物識別被廣泛套用在機場、車站等場所的嫌疑犯追逃和運動追蹤,也被電視台用來進行視頻索引和標籤。
高級IVA是識別音視頻對客群的感性刺激和情緒影響,比如識別一部電影中的淚點、笑點等,高級IVA才剛剛起步,還有很長的路要走。

技術前景

目前,IVA已被套用在EPG(電子節目單)自動校準、視頻自動索引和標籤、電視“搖一搖”等領域。IVA更具廣闊前景的套用是互動行銷(又稱心性行銷)。2011年,國內就引進歐美技術開始了在這方面的嘗試和探索。人性付費模式是在IVA技術基礎上的另一種延伸,利用IVA技術加強視頻內容與客群之間的情感聯繫,讓觀眾在一定情緒的引導下掏腰包。以《中國好聲音》為例,當觀眾被天籟的聲音所陶醉,通過IVA技術可以彈出互動視窗,讓觀眾為歌手獻上鮮花以資鼓勵;亦或是在破音時,用雞蛋表達無奈;甚至可以在選手表演時,直接通過手機參與到導師轉椅子的過程中。將傳統的被動收視改變為觀眾與觀眾之間、觀眾與節目之間全方位的互動,極大地激發出觀眾的存在感、溝通欲、控制欲等人性需求。當然,在播放廣告的過程中,在某個消費刺激點時利用IVA技術,可以出現互動按鈕,為感興趣的用戶直接提供行銷通道,將廣告、銷售合二為一。

相關詞條

熱門詞條

聯絡我們