研究方向
1. 大數據套用及安全:
基於大數據分析的情報發現與搜尋:利用大數據分析、自然語言處理和深度學習等方法對異構非結構化大數據進行智慧型分析處理分析,構建包括人物、機構、事件和群體等對象及其相互關係和活動的大量動態知識圖譜,並基於知識圖譜提供重要人物、事件情報分析,企業競爭情報分析、市場態勢分析、潛在客戶挖掘和特定目標深度挖掘等功能,為企業經營管理、投資與風險管理、政務服務與監管和社會秩序治理等方面提供情報的查詢、推送等服務。
大規模網路安全態勢分析與預測:面向空駝朽拔間網路安全的需求,基於網路空間大數據採集和存儲管理技術,採用數據分析、挖掘和智慧型推演等方法,構建大規模網路安全知識圖譜,從而發現重大網路安全事件、評估其危害,並預測其發展,並對整個全局網路安全態勢進行從微觀到巨觀的多層次、多粒度的全局掌握,給出全局視圖,為網路空間安宙連全提供決策支持。
2. 人工智慧套用及安全:
針對神經網路的攻擊研究:神經網路的廣泛套用在圖像識別、自然語言處理、語音識別等領域得到了廣泛套用。然而,神經網路自身缺乏可解釋性,針對神經網路的攻擊方法近年來開始出現。以圖像識別、機器翻譯為例,研究神經網路的攻擊方法,通過構造攻擊樣本,使得圖像識別出錯、機器翻譯正確率下降,並推廣到其他套用領域。
針對車輛、車牌識別的魯棒神經網路研究:神經網路已廣泛套用於人臉識別、車輛識別、車牌識別等領域,然而圖像質量較差時的識別效果很差。例如車輛快速運動導致圖像模糊、天氣惡劣情況下圖像明暗難以區分等,神經網路的識別效果較差。因此,結合神騙拒辯拔經網路的對抗學習方法,研究針對車輛、車牌識別的魯棒神經網路,提高不同圖像質量下的識別率。
機器人與環境互動、人機互動的安全性研究:使用深度學習技術賦能機器人視覺感知尤其是三維感知的駝厚拜能力;使用對抗神經網路提高機器人感知以及人機互動的安全性和魯棒性;使用3D列印技術設計更加安全的軟體機器人以及基於視覺反饋下的軟體機器人控制。
科研條件
大數據及安全研究所有大數據套用及安全和人工智慧套用及安全兩個主要方向,具體包括:精準高效的情報發現及搜尋技術;基於大規模網路安全知識圖譜的網路安全態勢分析和預測技術;針對深度神經網路的攻擊樣本生成方法;高魯棒性的神經網路架構設計;精準人物畫像系統;法院案件智慧型研判輔助系統等。研究所在立足於學術研究和探索的同時,也致力於推進前沿技術的落地實用。
科研成就
精準人物畫像系統:從網際網路獲取人物的公開信息,形成人物的精準畫像,包括人物的基本信息、學習經歷、工作經歷、項目經歷等內容,從數據源的驗證、數據準確性評估、多來源數據融合、基於知識圖譜的數據消歧、數據對齊和驗證、基於知識圖譜的數據推理、精準人物畫像系統的深度搜尋和互動等。
面向圖像識別的神經網路攻防平台:搭建面向人臉圖像和車牌圖像識別的神經網路攻防平台,提供已有的攻擊方法和防禦方法,提供攻防效果驗證和評測標準等。
面向機器翻譯的神經網路攻防平台:搭建面向機器翻譯神經網路的攻防平台,提供已有的攻擊方法和防禦方法,提供攻防效果驗證和評測標準等。
基於大數據分析的情報發現與搜尋系統“天箭”:天箭情報分析挖掘系統針對公安、安全、國信、政府部門等墊譽棕榜在反恐維穩、治理網路空間等方面的情報信息需求,基於網際網路公開數據源,進行情報信息的分析和挖掘。系統主要包括兩個個方面的功能,一是對特定人物情報的深度分析與挖掘,包括人物基本屬性、人物關係圖譜、人物的觀點言論、輿情話題、歷史活動、相關人物等等方面與人物相關的情報;二是對特定的群體、機構、事件的深度分析與挖掘,包括群體的發展歷史、文化、代表人物、意見領袖、政治組織、活動地點等;刻畫機構的基本情況、隸屬關係、職能、機構設定、人員編制、實力部署、歷史沿革、單位文化等情況;刻畫特定事件的內涵和外延,包括事件的起因、經過、發展、結果、相關人物、相關組織、社會評價等方面。
法院智判:利用大數據、自然語言處理、模式識別、深度學習等方法對大量異構非結構化的全國案件數據進行智慧型化分析和處理,形成智慧法官大腦通用平台,為法官提供案件要素分析、事實要素和判決依據自動生成、相似案件借鑑、併案關聯分析、案件判決風險控制、案件態勢分析和預判等服務,提高法官結案率、減輕判案工作壓力、降低判案風懂潤煮險、提升法官辦公效率。
商品搜尋和聚類原型系統:針諒殼妹對不同商家(貨源)提供的異構商品數據,發現數據之間的相似性,從而自動地實現相似商品的聚類,如下圖所示。將不同來源的相似數據聚類在一起,一方面可以提高用戶瀏覽和購物的興趣,屬於同一聚類的相似商品用戶可以一次性瀏覽並做對比;另一方面可以為下一步的數據分析和商品推薦提供有用的信息。未來可能嘗試將該系統套用於推薦系統或物聯網搜尋。
基於大數據分析的情報發現與搜尋系統“天箭”:天箭情報分析挖掘系統針對公安、安全、國信、政府部門等在反恐維穩、治理網路空間等方面的情報信息需求,基於網際網路公開數據源,進行情報信息的分析和挖掘。系統主要包括兩個個方面的功能,一是對特定人物情報的深度分析與挖掘,包括人物基本屬性、人物關係圖譜、人物的觀點言論、輿情話題、歷史活動、相關人物等等方面與人物相關的情報;二是對特定的群體、機構、事件的深度分析與挖掘,包括群體的發展歷史、文化、代表人物、意見領袖、政治組織、活動地點等;刻畫機構的基本情況、隸屬關係、職能、機構設定、人員編制、實力部署、歷史沿革、單位文化等情況;刻畫特定事件的內涵和外延,包括事件的起因、經過、發展、結果、相關人物、相關組織、社會評價等方面。
法院智判:利用大數據、自然語言處理、模式識別、深度學習等方法對大量異構非結構化的全國案件數據進行智慧型化分析和處理,形成智慧法官大腦通用平台,為法官提供案件要素分析、事實要素和判決依據自動生成、相似案件借鑑、併案關聯分析、案件判決風險控制、案件態勢分析和預判等服務,提高法官結案率、減輕判案工作壓力、降低判案風險、提升法官辦公效率。
商品搜尋和聚類原型系統:針對不同商家(貨源)提供的異構商品數據,發現數據之間的相似性,從而自動地實現相似商品的聚類,如下圖所示。將不同來源的相似數據聚類在一起,一方面可以提高用戶瀏覽和購物的興趣,屬於同一聚類的相似商品用戶可以一次性瀏覽並做對比;另一方面可以為下一步的數據分析和商品推薦提供有用的信息。未來可能嘗試將該系統套用於推薦系統或物聯網搜尋。