內容簡介
本書介紹終身學習這種高級機器學習範式,這種範式通過積累過去的知識持續地學習,並將學到的知識用於幫助在未來進行其他學習和解決問題。相比之下,當前主流的機器學習範式都是孤立學習,即給定一個訓練數據集,之後在這個數據集上運行機器學習算法以生成模型,然後再將該模型運用於預期的套用。這些範式不保留已經學到的知識,也不將其運用到後續的學習中。與孤立學習系統不同,人類只通過少量的樣例就能實現有效學習,這是因為人類的學習是知識驅動的,即只需少量的數據或付出,就能利用過去已經學到的知識去學習新事物。終身學習的目標就是模仿人類的這種學習能力,因為一個沒有持續學習能力的AI系統不能算作真正的智慧型。
自本書第1版出版以來,終身學習的研究在相對較短的時間內取得了顯著的進展。出版第2版是為了擴展終身學習的定義,更新部分章節的內容,並添加一個新的章節來介紹深度神經網路中持續學習的內容,這部分內容在過去的兩三年里一直被積極研究。部分章節的內容也進行了修改,使得內容更有條理,方便讀者閱讀。此外,作者希望為這一研究領域提出一個統一的框架。目前,在機器學習中有幾個與終身學習密切相關的研究課題,特別是多任務學習、遷移學習以及元學習,因為它們也採用了知識共享和知識遷移的思想。本書之所以集中介紹這些技術並討論其異同,目的是在介紹終身機器學習的同時,對該領域的重要研究成果和新想法進行全面回顧。本書適用於對機器學習、數據挖掘、自然語言處理或模式識別感興趣的學生、研究人員和從業人員。
圖書目錄
譯者序
前 言
致 謝
第1章 引言1
1.1 傳統機器學習範式1
1.2 案例3
1.3 終身學習簡史7
1.4 終身學習的定義9
1.5 知識類型和關鍵挑戰14
1.6 評估方法和大數據的角色17
1.7 本書大綱18
第2章 相關學習範式20
2.1 遷移學習20
2.1.1 結構對應學習21
2.1.2 樸素貝葉斯遷移分類器22
2.1.3 遷移學習中的深度學習23
2.1.4 遷移學習與終身學習的區別24
2.2 多任務學習25
2.2.1 多任務學習中的任務相關性25
2.2.2 GO-MTL:使用潛在基礎任務的多任務學習26
2.2.3 多任務學習中的深度學習28
2.2.4 多任務學習與終身學習的區別30
2.3 線上學習30
2.4 強化學習31
2.5 元學習32
2.6 小結34
第3章 終身監督學習35
3.1 定義和概述36
3.2 基於記憶的終身學習37
3.2.1 兩個基於記憶的學習方法37
3.2.2 終身學習的新表達37
3.3 終身神經網路39
3.3.1 MTL網路39
3.3.2 終身EBNN40
3.4 ELLA:高效終身學習算法41
3.4.1 問題設定41
3.4.2 目標函式42
3.4.3 解決第一個低效問題43
3.4.4 解決第二個低效問題45
3.4.5 主動的任務選擇46
3.5 終身樸素貝葉斯分類47
3.5.1 樸素貝葉斯文本分類47
3.5.2 LSC的基本思想49
3.5.3 LSC技術50
3.5.4 討論52
3.6 基於元學習的領域詞嵌入52
3.7 小結和評估數據集54
第4章 持續學習與災難性遺忘56
4.1 災難性遺忘56
4.2 神經網路中的持續學習58
4.3 無遺忘學習61
4.4 漸進式神經網路62
4.5 彈性權重合併63
4.6 iCaRL:增量分類器與表示學習65
4.6.1 增量訓練66
4.6.2 更新特徵表示67
4.6.3 為新類構建範例集68
4.6.4 在iCaRL中完成分類68
4.7 專家網關69
4.7.1 自動編碼網關69
4.7.2 測量訓練的任務相關性70
4.7.3 為測試選擇最相關的專家71
4.7.4 基於編碼器的終身學習71
4.8 生成式重放的持續學習72
4.8.1 生成式對抗網路72
4.8.2 生成式重放73
4.9 評估災難性遺忘74
4.10 小結和評估數據集75
第5章 開放式學習79
5.1 問題定義和套用80
5.2 基於中心的相似空間學習81
5.2.1 逐步更新CBS學習模型82
5.2.2 測試CBS學習模型84
5.2.3 用於未知類檢測的CBS學習84
5.3 DOC:深度開放式分類87
5.3.1 前饋層和一對其餘層87
5.3.2 降低開放空間風險89
5.3.3 DOC用於圖像分類90
5.3.4 發現未知類90
5.4 小結和評估數據集91
第6章 終身主題建模93
6.1 終身主題建模的主要思想93
6.2 LTM:終身主題模型97
6.2.1 LTM模型97
6.2.2 主題知識挖掘99
6.2.3 融合過去的知識100
6.2.4 Gibbs採樣器的條件分布102
6.3 AMC:少量數據的終身主題模型102
6.3.1 AMC整體算法103
6.3.2 挖掘must-link知識104
6.3.3 挖掘cannot-link知識107
6.3.4 擴展的Pólya瓮模型108
6.3.5 Gibbs採樣器的採樣分布110
6.4 小結和評估數據集112
第7章 終身信息提取114
7.1 NELL:永不停止語言學習器114
7.1.1 NELL結構117
7.1.2 NELL中的提取器與學習118
7.1.3 NELL中的耦契約束120
7.2 終身評價目標提取121
7.2.1 基於推薦的終身學習122
7.2.2 AER算法123
7.2.3 知識學習124
7.2.4 使用過去知識推薦125
7.3 在工作中學習126
7.3.1 條件隨機場127
7.3.2 一般依賴特徵128
7.3.3 L-CRF算法130
7.4 Lifelong-RL:終身鬆弛標記法131
7.4.1 鬆弛標記法132
7.4.2 終身鬆弛標記法133
7.5 小結和評估數據集133
第8章 聊天機器人的持續知識學習135
8.1 LiLi:終身互動學習與推理136
8.2 LiLi的基本思想139
8.3 LiLi的組件141
8.4 運行示例142
8.5 小結和評估數據集142
第9章 終身強化學習144
9.1 基於多環境的終身強化學習146
9.2 層次貝葉斯終身強化學習147
9.2.1 動機147
9.2.2 層次貝葉斯方法148
9.2.3 MTRL算法149
9.2.4 更新層次模型參數150
9.2.5 對MDP進行採樣151
9.3 PG-ELLA:終身策略梯度強化學習152
9.3.1 策略梯度強化學習152
9.3.2 策略梯度終身學習設定154
9.3.3 目標函式和最佳化154
9.3.4 終身學習的安全策略搜尋156
9.3.5 跨領域終身強化學習156
9.4 小結和評估數據集157
第10章 結論及未來方向159
參考文獻164
作者簡介
陳志源(Zhiyuan Chen),在伊利諾伊大學芝加哥分校劉兵教授的指導下獲得博士學位,博士論文題目為“終身機器學習:主題建模與分類”。他於2016年加入谷歌公司。他的研究興趣包括機器學習、自然語言處理、文本挖掘、數據挖掘和競價拍賣算法:他提出了幾種終身機器學習算法,實現了自動從文本文檔中挖掘信息,並在KDD、ICML、ACL、WWW、IJCAI和AAAI等主要會議上發表了超過15篇長篇研究論文。他還在IJCAI-2015、KDD-2016和EMNLP-2016上提供了三個關於終身機器學習的教程。他曾經是許多著名的自然語言處理、數據挖掘、人工智慧和網際網路研究會議的成員,並於201 5年獲得伊利諾州技術基金會頒發的有潛力50人獎,以表彰他的學術貢獻。
劉兵(Bing Liu),是伊利諾伊大學芝加哥分校的傑出教授,在愛丁堡大學獲得了博士學位。他的研究興趣包括終身學習、情感分析、數據挖掘、機器學習和自然語言處理,他在會議和期刊上發表了大量論文,其中兩篇論文獲得了KDD 10年Test-of-Time 獎,一篇論文獲得WSDM 10年Test-of-Time 獎。他也是4冊書的作者,其中2本關於情感分析,1本關於終身學習,1本關於數據挖掘。他的一些工作被媒體廣泛報導,包括《紐約時報》的頭版文章。他是2018 ACM SIGKDD創新獎的獲得者,也是很多數據挖掘會議(包括KDD、ICDM、CIKM、WSDM、SDM和PAKDD)的程式主席。他同時是包括TKDE、TWEB、DMKD和TKDD在內的期刊的副編輯,還是很多自然語言處理、人工智慧、網路和數據挖掘會議的領域主席或者高級程式委員會成員,並且曾經是2013~2017年ACM SIGKDD的主席,是ACM、AAAI和IEEE會士。
陳健,現任華南理工大學教授、博士生導師,並擔任中國計算機學會高級會員、中國計算機學會資料庫專業委員會委員、廣東省計算機學會大數據專業委員會副主任、廣東省計算機學會資料庫分會理事、秘書長、廣東省計算機學會計算智慧型專業委員會委員。曾在加拿大西蒙弗雷澤大學計算機科學學院和新加坡國立大學計算學院從事數據挖掘和機器學習方面的研究工作,並主持多項國家、省級項目。近十年以來,在國際學術期刊和國際會議上發表論文六十多篇,出版譯著四部,主編叢書一部。