網路智慧型化中的深度強化學習技術

內容簡介

隨著人工智慧技術的廣泛套用，網路智慧型化近年來受到廣泛的關注，已經成為下一代移動通信與未來網路的重要技術。阿爾法圍棋（AlphaGo）之後，深度強化學習不斷推陳出新，為網路中的決策問題提供了有效的潛在解決方案。本書系統介紹了網路智慧型化中深度強化學習的基本理論、算法及套用場景。全書共8章，針對網際網路、移動通信網、邊緣網路、數據中心等典型網路，闡述了網路管理、網路控制、任務調度等決策需求，深入論述了深度強化學習的模型構建與套用技術。第1章介紹了網路智慧型的需求與挑戰；第2章介紹了先進的深度強化學習模型與方法；第3～6章論述了無線接入最佳化、網路管理、網路控制與任務調度等普遍網路管控任務中，深度強化學習技術的套用方法；第7章和第8章論述了深度強化學習在流媒體控制以及自組織網路等典型場景中的新研究進展。

本書可為高等院校計算機和通信相關專業的本科生、研究生提供參考，也可供對網路智慧型化與深度強化學習領域感興趣的研究人員和工程技術人員參考。

作者簡介

戚琦，博士，網路與交換國家重點實驗室副教授、碩士生導師、博士生導師。長期從事業務網路智慧型化和移動雲計算方向的科研工作，近年來重點關注深度強化學習、分散式機器學習、聯邦學習、輕量化神經網路等方面的前沿研究，取得了知識定義網路、邊緣智慧型、手部姿態估計、草圖檢索等一系列研究成果。發表高水平學術論文70餘篇，SCI索引期刊論文40餘篇。先後主持2項國家自然科學基金目，1項北京市自然科學基金，3項基地自主科研項目，以及多項企事業單位合作項目，作為主研人承擔重點研發計畫、創新團隊、創新群體、973等多個國家及省部級重大項目。

圖書目錄

第 1章網路智慧型概述 1

1．1 概述 2

1．1．1 網路架構的持續演進 2

1．1．2 網路管理與控制的挑戰 3

1．1．3 網路智慧型的興起 4

1．2 網路智慧型的基礎 7

1．2．1 大數據 7

1．2．2 算力支持 7

1．2．3 集中式控制 9

1．3 網路智慧型的現狀 10

1．3．1 意圖網路 10

1．3．2 自動駕駛網路 12

1．3．3 知識定義網路 14

1．3．4 標準化工作 17

1．4 網路智慧型的實現途徑 18

1．4．1 監督學習 18

1．4．2 無監督學習 20

1．4．3 強化學習 21

1．5 網路智慧型的願景與挑戰 22

1．5．1 網路智慧型的願景 22

1．5．2 網路智慧型的挑戰 24

參考文獻 25

第 2章深度強化學習方法 29

2．1 強化學習方法概述 30

2．1．1 馬爾可夫決策過程 30

2．1．2 多臂賭博機 32

2．1．3 蒙特卡洛樹搜尋與時間差分方法 33

2．1．4 值疊代與策略疊代 35

網路智慧型化中的深度強化學習技術

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條