《海量眾包數據管理的關鍵技術》是依託華東師範大學,由王曉玲擔任項目負責人的面上項目。
基本介紹
- 中文名:海量眾包數據管理的關鍵技術
- 項目類別:面上項目
- 項目負責人:王曉玲
- 依託單位:華東師範大學
項目摘要,結題摘要,
項目摘要
眾包(例如亞馬遜的AMT)作為一種新興的商業模式,通過線上社區的形式,尋求新數據或新觀點。眾包數據是對DBMS 數據的補充,如何將封閉世界(DBMS 建立的前提)與開發世界(眾包數據的來源)結合起來,通過眾包數據擴大DBMS中數據的廣度和深度,是當前的研究熱點。然而,眾包套用所產生的大數據,具有不完整性、主觀性、噪音干擾等特點,加劇了數據管理的複雜性和難度。本課題面向從實際套用中所萃取的關於眾包數據管理的基礎研究問題。我們擬從分析DB-hard問題(需要理解和主觀分析的數據)入手,以關係-眾包數據引擎為核心,探索海量眾包數據管理中的理論與關鍵技術。研究內容包括:眾包任務的建模與組織、眾包數據的查詢與分析、自適應的個性化搜尋、線上檢測等技術,為新型的眾包套用提供數據管理的理論基礎和技術。並開發實現面向MOOC套用的眾包數據管理平台的原型系統,探索具有自主智慧財產權的工具棧,支撐現實套用。
結題摘要
課題組根據項目任務書,以華師大課題組為核心,聯合東南大學和魯東大學的研究團隊,開展了海量眾包數據管理的關鍵技術研究,特別在探索了五個方面的理論、方法和系統的相關技術:1、眾包套用中的軌跡數據管理和移動計算技術;2、基於眾包數據的推薦技術;3、眾包用戶行為建模分析及任務分發4、眾包環境中的用戶位置和用戶查詢的隱私保護技術;5、分析型查詢的最佳化框架和相關最佳化技術。完成預期任務,所探索的關鍵技術和原型系統已經在實際套用中開展了示範套用,有望推廣到更多現實套用中。 項目開展期間,發表了學術論文31篇,其中CCF A類論文3篇,CCF B類論文6篇,CCF C類論文7篇,SCI期刊論文6 篇。申請軟體著作權5項,申請專利5項,獲得2017全國資料庫年會優秀會議論文1項。培養碩士研究生10名,博士研究生2名。組織了4次學術交流和技術交流會,與國內外專家進行了眾包數據管理相關的關鍵技術研討;項目負責人作為會議聯合主席,組織了大數據管理和數據服務國際會議BDMS2016、BDMS2017、BDMS2018、BDMS2019四次國際學術會議,與國際專家交流了相關技術。完成了預期目標。