《面向大數據的媒體內容分析與關聯語義挖掘研究》是依託南京大學,由瞿裕忠擔任項目負責人的專項基金項目。
基本介紹
- 中文名:面向大數據的媒體內容分析與關聯語義挖掘研究
- 項目類別:專項基金項目
- 項目負責人:瞿裕忠
- 依託單位:南京大學
項目摘要,結題摘要,
項目摘要
在諸如深度Web搜尋等套用領域,大數據媒體處理和智慧型化套用需求日益增多。大數據媒體隱含著很多有價值的信息和語義,且不同來源和類型的媒體數據間隱含著很多深度的信息關聯性,因此,分析和挖掘多源異質媒體大數據,將有助於挖掘和發現很多深度信息和事實,因此大數據媒體分析和挖掘技術具有極為重要的研究意義和套用價值。然而大數據媒體分析處理面臨很多技術難題。本項目擬研究面向大數據的媒體內容分析與關聯語義挖掘技術,重點研究所涉及的複雜的媒體內容和語義分析技術、面向大數據媒體處理的各種機器學習和數據挖掘技術方法、大數據媒體處理並行化計算方法和算法。為了進一步利用多源異質大數據媒體所隱含的豐富的信息關聯性完成深度挖掘和事實發現,本項目將在媒體內容和語義分析的基礎上,進一步研究多源異質媒體語義的關聯融合和深度挖掘技術,為套用行業提供各種媒體挖掘套用和服務。
結題摘要
圍繞面向大數據媒體語義理解的機器學習理論與算法、媒體大數據分布存儲和並行計算模型與框架、面向大數據的媒體內容和語義分析研究和大數據媒體語義的融合與深度挖掘等研究內容,項目組開展了系統而深入的研究。 在機器學習理論與算法方面,著重研究了面向複雜媒體對象的學習算法、複雜對象學習中的最佳化問題求解理論與算法、面向複雜對象學習的高效求解方法。有關成果有助於改進針對複雜媒體對象的學習性能,提高學習方法的效用與效率。 在分布存儲和並行計算模型與框架方面,系統地研究了面向媒體大數據處理的並行化算法、混合式和通用化並行計算模型與框架、媒體大數據分散式存儲管理模型和訪問方法、媒體大數據處理的並行計算構架和支撐平台。有關成果可提升大數據分析套用系統的性能,基於矩陣模型的媒體大數據機器學習與數據分析編程模型與框架實現了底層平台對上層數據分析程式設計師的透明性。 在媒體內容和語義分析方面,深入研究了面向媒體內容中複雜語義概念的識別、多源異構媒體語義關聯關係分析技術、數據多樣性文本的語義分析。有關成果為物體層級的語義分析提供了基礎,有效地改進圖像檢索、照片增強、顯示適配等具體套用的效果,可以有效地對多樣性文本進行有效的分析處理,並將文本信息與語義知識體系進行關聯。 在媒體語義的融合與深度挖掘方面,深入研究了面向海量媒體語義數據的存取,海量語義異構數據的融合,海量媒體語義信息的檢索和摘要,以及海量語義信息的分析。有關成果為異構數據融合及服務提供了性能保障,能夠有效處理語義信息檢索與分析中的異構性問題,提升語義檢索服務的有效性。 在成果轉化及套用方面,對開源大數據系統Apache Spark和Alluxio做出了持續的重要貢獻,並研發了多個面向媒體大數據分析處理的套用系統。本項目發表論文80篇,出版專著1本,申請專利9項和軟體著作權2項,其中,期刊論文有16篇,會議論文64篇,SCI收錄9篇,EI收錄63篇;根據CCF的分類,A類論文有9篇,B類18篇,C類19篇。