《基於複雜網路結構和相關性的網際網路流量識別方法研究》是依託北京郵電大學,由吳曉非擔任項目負責人的面上項目。
基本介紹
- 中文名:基於複雜網路結構和相關性的網際網路流量識別方法研究
- 項目類別:面上項目
- 項目負責人:吳曉非
- 依託單位:北京郵電大學
項目摘要,結題摘要,
項目摘要
網際網路流量識別問題對網路生活和網路建設具有重要的理論和實際意義。本課題從網際網路流量記錄出發,構造流量網路。運用複雜網路的原理和方法,研究其網路結構的度分布、介數、中心度等統計特徵,研究其節點、邊、流量等的相關性信息,檢測和研究其社群結構的拓撲和結構特徵。通過這些研究,掌握流量的統計、主機和業務相關性、業務互動特徵等要素,構造流量業務模型,揭示不同種類業務和流量的差異。以此為基礎,研究新的網際網路業務和流量識別方法。.本課題創新之處在於:不再從單一流的信息(如特徵字和流統計信息)研究流量識別問題,而是從網路互動的角度,研究信息交流這一根本要求在網路和業務套用中體現的特徵和規律,從流量網路的整體特性研究不同業務和流量的區別和聯繫,從而達到流量識別的目的。
結題摘要
網際網路流量識別的基本任務是確定一條網際網路流量承載的是何種業務和信息。流量識別是網際網路用戶行為分析的基礎,對於實際網路和業務的管理、規劃、安全等都具有重要的現實意義。 本項目旨在研究由網際網路流量記錄生成的流量網路的統計和結構特徵,分析其節點和流量的相關性,探查其網路的社團結構,揭示網際網路業務流的網路屬性和特徵。其目標在於:產生一種基於網際網路流量互動特性的流量和業務識別方法,結合已有的流量識別算法,改進識別的準確性和性能。 本項目主要研究內容和創新點如下: (1)利用網際網路流量監控設備從實際的ISP網路中採集了典型日期的流量數據,並根據研究需要構建了基於Hadoop的分散式數據處理平台,以用於大規模流量網路的特性分析和算法驗證; (2)構建了以特定IP位址的主機作為節點、以一對主機之間具有的流量互動作為邊的流量網路,表征了流量互動的網路屬性,並對各種流量網路的基本圖屬性進行了詳盡的分析; (3)基於各種網際網路套用所構建的流量網路,著重研究了流量網路的熵特性、社團結構特徵和相關性,討論了各種套用內部和套用之間的區別和聯繫; (4)在現有複雜網路BA模型的基礎上,提出了適用於流量網路的複雜網路模型,並對新模型進行了理論和仿真分析,證明其在度分布和熵增長方面都與實際的流量網路相匹配; (5)考慮到流量網路的尺度受到計算能力的限制,提出了基於滑動視窗的流量圖模型(SWG),以分析移動套用流量的動態特徵,通過實際數據驗證了SWG模型在移動用戶行為分析方面的有效性和準確性; (6)針對移動套用流量,提出了伺服器中心性、用戶並發性和流量一致性三維度量,並分析了典型移動套用在三維空間的聚類特性; (7)利用經典數據挖掘方法,對移動APP及URL進行了關聯分析,提取了移動用戶使用APP或訪問網站的興趣偏好,並針對流行的移動IM套用,分析了套用流量的自相似性; (8)深入研究了用於複雜網路社團發現的標籤傳播算法(LPA),並根據流量識別的目標對其進行擴展,提出了基於先驗信息的標號初始化方法以及新的標號傳播和更新策略,對新算法進行了仿真分析,證明其能較好地用於節點流量識別。 項目歷時4年,已按計畫完成研究內容和目標。項目組成員在國內外學術刊物和會議上已發表論文12篇,培養青年骨幹教師2名和相關方向碩士研究生9名,並與國內外大學建立了長期穩定的學術合作和交流機制。