該書系統地闡述了P2P流量識別技術。首先綜述了P2P流量識別技術現狀和最新的研究成果, 在此基礎上詳細闡述作者提出的6種P2P流量檢測模型: 基於滑動視窗機制的P2P流量識別模型、基於通信網路拓撲結構的P2P流量識別模型、基於BP算法的P2P流量識別模型、基於多重特徵分類的P2P流量識別算法、基於SVM的P2P流量識別方法的設計與實現以及基於流特徵描述的模糊識別算法。 在理論研究的基礎上,作者將上述模型和算法套用到具體的項目開發中,取得了良好的效果。
該書是作者多年從事科研項目研究的成果結晶,書中內容都來自具體的項目,有很好的工程基礎,特色是學術與具體的工程套用相結合。本書可作為計算機科學與技術、網路與信息安全相關專業研究生及高年級本科生的教材,也可作為科研人員的參考書,同時可作為研究生、博士生及教師論文寫作的參考書。
基本介紹
- 書名:《P2P流量識別方法研究》
- 作者:孫知信
- ISBN:9787302340720
- 定價:39元
- 裝幀:平裝
- 印次:1-1
- 印刷日期:2014-6-24
圖書目錄,前沿目錄,
圖書目錄
第1章緒論
1.1P2P形成背景及概念
1.1.1P2P產生背景
1.1.2P2P概念
1.2網路拓撲結構
1.2.1網路拓撲結構概念
1.2.2傳統網路拓撲結構
1.2.3P2P網路拓撲結構
1.2.4結構化與非結構化模型的區別
1.3P2P業務
1.3.1P2P業務特徵
1.3.2P2P的主要套用領域
1.4P2P流量識別
1.4.1P2P技術套用困境
1.4.2P2P流量識別研究意義
1.4.3P2P流量識別研究現狀
1.5本書的研究內容
本章參考文獻
第2章基於滑動視窗機制的P2P流量識別模型(SWP2PIM)
2.1基於滑動視窗機制的P2P流量識別方法的基本原理
2.1.1滑動視窗機制
2.1.2滑動視窗機制在P2P流量識別模型中的定義
2.2基於滑動視窗機制的特性量化
2.2.1滑動視窗機制在流量特性量化中的套用
2.2.2P2P流量連續性量化
2.2.3P2P流量多連線性量化
2.2.4P2P流量協定混合特性量化
2.2.5P2P流量連線埠離散性量化
2.2.6輸入/輸出均衡性量化
2.3一次P2P流量識別策略
2.4基於滑動視窗機制的二次P2P流量識別策略
2.5基於滑動視窗機制的P2P流量識別與控制仿真系統
2.5.1系統概述
2.5.2系統各模組結構
2.6SWP2PIM系統功能測試
2.6.1P2P軟體流量分析
2.6.2傳統C/S軟體流量分析
2.6.3未知類型P2P軟體流量分析
2.7本章小結
本章參考文獻
第3章基於通信網路拓撲結構的P2P流量識別模型(P2PCNTIM)
3.1基於通信網路拓撲結構的P2P流量識別模型(P2PCNTIM)概述
3.1.1P2P通信網路拓撲特徵分析
3.1.2P2P流量識別確定性特徵選擇
3.1.3獲取通信對端類型關鍵技術
3.2P2PCNTIM流量識別模型中的關鍵技術
3.2.1P2PCNTIM特徵判斷函式
3.2.2P2PCNTIM調度機制
3.2.3P2PCNTIM核心過程
3.3P2PCNTIM系統的設計
3.3.1P2PCNTIM系統的功能
3.3.2P2PCNTIM系統結構
3.4P2PCNTIM系統的實現
3.4.1數據包提取分析模組
3.4.2P2P流量識別模組
3.4.3P2P套用識別模組
3.4.4P2P控制管理模組
3.5P2PCNTIM系統測試
3.5.1測試環境
3.5.2誤判率測試分析
3.5.3準確率測試分析
3.5.4識別效率分析
3.6本章小結
本章參考文獻
第4章基於BP算法的P2P流量識別模型
4.1BP神經網路的基本概念
4.1.1BP神經網路簡介
4.1.2BP算法介紹
4.1.3BP算法實現步驟
4.2BP算法的缺陷與改進
4.2.1傳統BP算法的缺陷
4.2.2BP算法的改進
4.3.3改進BP算法的性能對比實驗
4.3基於BP算法的P2P流量識別系統(IBPNNP2PIM)的模型設計與實現
4.3.1IBPNNP2PM模型的提出
4.3.2數據採集模組
4.3.3流量特徵抽取模組
4.3.4流分類器模組
4.4IBPNNP2PIM系統測試與結果分析
4.4.1樣本數據獲取
4.4.2流分類器網路訓練
4.4.3流分類器網路測試
4.4.4線上識別測試
4.5本章小結
本章參考文獻
第5章基於多重特徵分類的P2P流量識別算法(MCCP2PIM)
5.1多重特徵提取分類方法的設計思想
5.1.1P2P連線特徵分析
5.1.2P2P深層數據包特徵分析
5.1.3P2P流量統計特徵分析
5.2MCCP2PIM系統的設計模型
5.2.1數據採集模組的設計
5.2.2數據預處理模組的設計
5.2.3多重特徵提取模組的設計
5.2.4多重特徵識別模組的設計
5.3MCCP2PIS系統設計與實現
5.3.1MCCP2PIM系統概述
5.3.2MCCP2PIS系統模組設計與實現
5.4MCCP2PIS系統測試與結果分析
5.4.1計算數據包長抖動頻次的準確性測試
5.4.2BP網路訓練測試
5.4.3多重特徵流量識別的準確性和高效性測試
5.5本章小結
本章參考文獻
第6章基於SVM的P2P流量識別方法的設計與實現
6.1SVM原理
6.1.1統計學習理論
6.1.2SVM思想
6.1.3SVM核函式
6.1.4與SVM相關的技術研究
6.2基於改進SVM的P2P流量檢測模型
6.2.1針對大規模訓練集的支持向量機學習策略
6.2.2基於改進SVM的P2P流量檢測系統模型設計思路
6.2.3P2P流量特徵分析
6.2.4基於SVM的P2P流量樣本剪裁方法
6.2.5基於改進SVM的P2P流量識別系統模組設計
6.2.6基於SVM的P2P流量識別系統的配置
6.2.7基於SVM的P2P流量識別系統的測試與性能分析
6.3基於SVM與DPI的P2P流量識別方法
6.3.1研究背景
6.3.2主要思想
6.3.3基本方案
6.3.4系統實現
6.3.5系統測試與分析
6.4基於MSVM的P2P流量識別模型
6.4.1研究背景
6.4.2主要思想
6.4.3基本方案
6.5本章小結
本章參考文獻
第7章基於流特性描述的模糊識別算法
7.1背景介紹
7.2模糊集合
7.2.1模糊集合的概念
7.2.2隸屬函式的確定與選擇
7.2.3模糊集合的截集與模糊性的度量
7.3模糊綜合評價法
7.3.1模糊綜合評價法的術語及其定義
7.3.2模糊綜合評價法的特點
7.3.3模糊綜合評價法的應用程式
7.4模糊評判規則
7.4.1數據包集合的描述
7.4.2隸屬度函式的定義
7.5基於流特徵描述的模糊識別方法(FCD)
7.6FCD模糊識別方法在識別網路遊戲中的套用和分析
7.6.1用FCD模式識別方法識別“魔獸世界”
7.6.2隸屬度函式分析
7.6.3結果分析
7.7FCD模糊識別方法在識別其他P2P中的套用
7.7.1Skype 特性
7.7.2Skype的檢測流程
7.7.3FCD模糊識別Skype的過程
7.8本章小結
本章參考文獻
1.1P2P形成背景及概念
1.1.1P2P產生背景
1.1.2P2P概念
1.2網路拓撲結構
1.2.1網路拓撲結構概念
1.2.2傳統網路拓撲結構
1.2.3P2P網路拓撲結構
1.2.4結構化與非結構化模型的區別
1.3P2P業務
1.3.1P2P業務特徵
1.3.2P2P的主要套用領域
1.4P2P流量識別
1.4.1P2P技術套用困境
1.4.2P2P流量識別研究意義
1.4.3P2P流量識別研究現狀
1.5本書的研究內容
本章參考文獻
第2章基於滑動視窗機制的P2P流量識別模型(SWP2PIM)
2.1基於滑動視窗機制的P2P流量識別方法的基本原理
2.1.1滑動視窗機制
2.1.2滑動視窗機制在P2P流量識別模型中的定義
2.2基於滑動視窗機制的特性量化
2.2.1滑動視窗機制在流量特性量化中的套用
2.2.2P2P流量連續性量化
2.2.3P2P流量多連線性量化
2.2.4P2P流量協定混合特性量化
2.2.5P2P流量連線埠離散性量化
2.2.6輸入/輸出均衡性量化
2.3一次P2P流量識別策略
2.4基於滑動視窗機制的二次P2P流量識別策略
2.5基於滑動視窗機制的P2P流量識別與控制仿真系統
2.5.1系統概述
2.5.2系統各模組結構
2.6SWP2PIM系統功能測試
2.6.1P2P軟體流量分析
2.6.2傳統C/S軟體流量分析
2.6.3未知類型P2P軟體流量分析
2.7本章小結
本章參考文獻
第3章基於通信網路拓撲結構的P2P流量識別模型(P2PCNTIM)
3.1基於通信網路拓撲結構的P2P流量識別模型(P2PCNTIM)概述
3.1.1P2P通信網路拓撲特徵分析
3.1.2P2P流量識別確定性特徵選擇
3.1.3獲取通信對端類型關鍵技術
3.2P2PCNTIM流量識別模型中的關鍵技術
3.2.1P2PCNTIM特徵判斷函式
3.2.2P2PCNTIM調度機制
3.2.3P2PCNTIM核心過程
3.3P2PCNTIM系統的設計
3.3.1P2PCNTIM系統的功能
3.3.2P2PCNTIM系統結構
3.4P2PCNTIM系統的實現
3.4.1數據包提取分析模組
3.4.2P2P流量識別模組
3.4.3P2P套用識別模組
3.4.4P2P控制管理模組
3.5P2PCNTIM系統測試
3.5.1測試環境
3.5.2誤判率測試分析
3.5.3準確率測試分析
3.5.4識別效率分析
3.6本章小結
本章參考文獻
第4章基於BP算法的P2P流量識別模型
4.1BP神經網路的基本概念
4.1.1BP神經網路簡介
4.1.2BP算法介紹
4.1.3BP算法實現步驟
4.2BP算法的缺陷與改進
4.2.1傳統BP算法的缺陷
4.2.2BP算法的改進
4.3.3改進BP算法的性能對比實驗
4.3基於BP算法的P2P流量識別系統(IBPNNP2PIM)的模型設計與實現
4.3.1IBPNNP2PM模型的提出
4.3.2數據採集模組
4.3.3流量特徵抽取模組
4.3.4流分類器模組
4.4IBPNNP2PIM系統測試與結果分析
4.4.1樣本數據獲取
4.4.2流分類器網路訓練
4.4.3流分類器網路測試
4.4.4線上識別測試
4.5本章小結
本章參考文獻
第5章基於多重特徵分類的P2P流量識別算法(MCCP2PIM)
5.1多重特徵提取分類方法的設計思想
5.1.1P2P連線特徵分析
5.1.2P2P深層數據包特徵分析
5.1.3P2P流量統計特徵分析
5.2MCCP2PIM系統的設計模型
5.2.1數據採集模組的設計
5.2.2數據預處理模組的設計
5.2.3多重特徵提取模組的設計
5.2.4多重特徵識別模組的設計
5.3MCCP2PIS系統設計與實現
5.3.1MCCP2PIM系統概述
5.3.2MCCP2PIS系統模組設計與實現
5.4MCCP2PIS系統測試與結果分析
5.4.1計算數據包長抖動頻次的準確性測試
5.4.2BP網路訓練測試
5.4.3多重特徵流量識別的準確性和高效性測試
5.5本章小結
本章參考文獻
第6章基於SVM的P2P流量識別方法的設計與實現
6.1SVM原理
6.1.1統計學習理論
6.1.2SVM思想
6.1.3SVM核函式
6.1.4與SVM相關的技術研究
6.2基於改進SVM的P2P流量檢測模型
6.2.1針對大規模訓練集的支持向量機學習策略
6.2.2基於改進SVM的P2P流量檢測系統模型設計思路
6.2.3P2P流量特徵分析
6.2.4基於SVM的P2P流量樣本剪裁方法
6.2.5基於改進SVM的P2P流量識別系統模組設計
6.2.6基於SVM的P2P流量識別系統的配置
6.2.7基於SVM的P2P流量識別系統的測試與性能分析
6.3基於SVM與DPI的P2P流量識別方法
6.3.1研究背景
6.3.2主要思想
6.3.3基本方案
6.3.4系統實現
6.3.5系統測試與分析
6.4基於MSVM的P2P流量識別模型
6.4.1研究背景
6.4.2主要思想
6.4.3基本方案
6.5本章小結
本章參考文獻
第7章基於流特性描述的模糊識別算法
7.1背景介紹
7.2模糊集合
7.2.1模糊集合的概念
7.2.2隸屬函式的確定與選擇
7.2.3模糊集合的截集與模糊性的度量
7.3模糊綜合評價法
7.3.1模糊綜合評價法的術語及其定義
7.3.2模糊綜合評價法的特點
7.3.3模糊綜合評價法的應用程式
7.4模糊評判規則
7.4.1數據包集合的描述
7.4.2隸屬度函式的定義
7.5基於流特徵描述的模糊識別方法(FCD)
7.6FCD模糊識別方法在識別網路遊戲中的套用和分析
7.6.1用FCD模式識別方法識別“魔獸世界”
7.6.2隸屬度函式分析
7.6.3結果分析
7.7FCD模糊識別方法在識別其他P2P中的套用
7.7.1Skype 特性
7.7.2Skype的檢測流程
7.7.3FCD模糊識別Skype的過程
7.8本章小結
本章參考文獻
前沿目錄
的概念最早於1969年由Steve Crocker提出,每個參與P2P網路服務的主機都稱為一個Peer,由Peer連線構成的網路就稱為P2P網路。P2P網路不僅能提供快速高效的檔案共享、低成本高可用的計算資源和存儲資源共享,而且具有強大的網路連通性,以及更直接、更靈活的信息傳送能力。然而,P2P網路在提供高效快速資源共享的同時,也帶來了眾多的問題: P2P對傳輸速度的需求高,且P2P套用的數據交換具有一對多、突發性和分散式特性,P2P用戶的超大容量下載消耗了大量頻寬; 其用戶搶占了60%~80%的網路頻寬,容易引起企業及ISP瓶頸鏈路的阻塞; P2P 用戶不分時段地進行高速下載,增大網路設備的負荷,容易造成尖峰時段的鏈路擁塞等。隨著P2P套用的快速發展,P2P指數級增長的數據傳輸使得網路頻寬資源更加緊張。因此,為了確保其他正常網路用戶的服務,同時為了更好地發揮P2P技術的優勢,對P2P流量進行分類、識別就成為目前業內研究的一個熱點。
本書作者從2004年開始研究P2P流量識別的相關技術,先後得到國家自然科學基金、科技部中小企業創新基金、國家重點實驗室基金、江蘇省自然基金、江蘇省高校自然基金項目及企業委託項目的資助,取得了以下成果。
(1) 立足於P2P協定最基本的特點,研究並總結出P2P流量的多個統計特性,提出了基於滑動視窗機制的P2P流量識別模型(SWP2PIM),並建立了P2P流量識別與控制仿真系統,詳細內容在第2章中闡述。
(2) 根據P2P獨有的通信網路拓撲結構特徵,提出了基於通信網路拓撲結構的P2P流量識別模型(P2PCNTIM),該模型使用多主機特徵以及通信對端類型特徵對P2P流量進行識別,並將這兩個特徵有機地結合起來以提高識別的準確率和識別效率,第3章給出了詳細分析。
(3) 將BP網路套用於P2P流識別,提出了一種基於改進BP算法的P2P流識別模型(IBPNNP2PIM)。針對傳統BP算法的缺陷,在總結了他人研究成果的基礎上,對傳統BP算法進行了改進,並將其套用於模型中流分類器模組的設計,與採用傳統BP算法的流分類器相比,IBPNNP2PIM對P2P流的識別具有一定的有效性和優越性,第4章展示了其套用效果。
(4) 通過大量的實驗對比分析P2P套用和非P2P套用,總結出P2P的連線特徵、深層數據包特徵和流量統計特徵這些特徵,並在此基礎上提出了基於多重特徵分類的P2P流量識別模型(MCCP2PIM),第5章中對該系統實現進行了剖析。
(5) 基於近幾年對支持向量機(Support Vector Machines,SVM)技術的深入研究,致力於將SVM技術運用到P2P流量識別中,分別提出了基於改進SVM的P2P流量檢測模型、基於P2P與DPI(Deep Packet Inspection,深度包檢測)的P2P流量識別方法以及基於MSVM(Multidimensional Support Vector Machine,多維SVM)的P2P流量識別模型,第6章描述了這3個模型及其系統的成果。
(6) 首次將模糊數學的理論運用到P2P數據流的識別中,提出了一種基於流特徵描述的模糊識別方法(FCD)。該識別方法能夠較好地識別網路流量中的某些網路套用流,對於其他的網路套用流量識別同樣適用,具有較好的準確性和可擴展性,第7章對此進行了深入分析和闡述。
本書是項目組集體成果的結晶,他們是宮婧副教授、劉三民博士、焦琳碩士、姜舉良碩士、陳松樂博士、卜凱博士、許劉兵碩士、余小芳碩士、顏小倩碩士、高同碩士、張玉峰碩士等,在此書交稿之際,謹向他們對本書做出的貢獻表示衷心的感謝。另外,感謝宮婧副教授、劉三民博士、汪胡青博士、何麗萍博士在本書撰寫過程中給予的幫助。
感謝我的愛人張娟和兒子孫翌博,他們是我寫書的動力所在。
最後要感謝清華大學出版社的領導和編輯,沒有他們的辛勤勞動,就沒有本書的出版。