谷歌AI中國中心在北京成立。該中心將由李飛飛和Google Cloud研發負責人李佳博士共同領導。
基本介紹
- 中文名:谷歌AI中國中心
- 外文名:Google AI China Center
- 成立時間:2017年12月13日
- 地點:北京
產品服務,發展經歷,管理團隊,AI Journey(AI 歷程),定義目標,收集數據,設計算法,形成整體解決方案,
產品服務
谷歌AI中國中心的重點會是基礎 AI 研究,同時會與充滿活力的中國學術界建立持續發展的合作關係。為更廣大的學生及研究人員提供高質量的 AI 及機器學習教育支持。
發展經歷
2017年12月13日,Google 中國開發者大會召開。會上,Google Cloud人工智慧和機器學習團隊首席科學家李飛飛宣布,谷歌AI中國中心在北京成立。
管理團隊
谷歌AI中國中心由李飛飛和Google Cloud研發負責人李佳共同領導,李飛飛除了負責中心的研究工作,也會統籌Google Cloud AI,Google Brain以及中國本土團隊的工作。
AI Journey(AI 歷程)
定義目標
這個 AI 的歷程通常是從最初的問題定義開始,比如圖像分類識別。如果想從這個圖裡面識別出有個毛線團,這個問題的表達形式有很多種,它的解決方案也有各種各樣的。
收集數據
這裡就有一個例子,在自動駕駛技術中我們根本沒有辦法去訓練算法如何應對交通事故,或者比較罕見遇到的交通情況,因為沒有這樣的數據。這種情況是否能有替代做法呢?我想提下這個模擬器的技術。這樣我們可以自由生成各種各樣的數據,來表現這些複雜的情況。
這個技術經常被用在遷移學習裡面,我們可能在原有領域有很多數據,但很難在新的領域收集同樣多的數據;這是其中一個問題。還有很多其它問題,比如說我們在谷歌雲上面遇到的很多問題,它們通常是沒有已知的解決辦法的,它們也沒有辦法找到這樣大量的數據。
我們這裡要解決的是一個小數據的問題,不是大數據的問題。在這個過程中,遷移學習、模擬器技術都是非常值得去研究去探索的,在能夠真正的解決實際問題之前,能夠達到我們希望的能夠處理任何情況之前,先用這樣的技術讓模型快速成長。
我們同時也能挖掘出一個很大的寶藏,機器人技術。比如說用模擬器的方法解決機器人技術的問題。
設計算法
我剛才談到一些有關模擬器生成數據的探索,實際上算法也對這個領域至關重要,其中包含了怎么樣有效讓我們人指導機器來進行學習。當然,讓機器學習也還有各種不同的辦法。
我剛才談到了機器人方面的很多問題,另外一個大的方向是自然語言。大家看到有很多的好玩的聊天機器人,是一種為了好玩的、隨意的聊天。但是在我們人和人之間,我們聊天的雙方或者是多方是有不同的背景的,整個聊天的過程是有一個希望達成的目的的。對話的目的的理解、利用和算法更新都做得不多。所以很多問題,很多聊天的問題是有一個目標需要完成的,這樣才能讓機器和人類的交流更有價值。我們非常感興趣將來繼續探索這方面的問題。
形成整體解決方案
在谷歌雲,我們有非常非常多的傳統的行業跟我們進行合作,我們在跟他們交流的過程或者溝通的過程,發覺有好多的問題,我們整個 AI 領域還沒有給予特別多的關注,比如說其中一個就是 AI 醫療。
我們知道醫療技術裡面,實際上有很多非常非常有意思的問題,比如說我們的醫生資源非常少,特別是中國,一個醫生一天看上百人的病人,我覺得這對醫生來說是非常繁重的勞動,而且病人也沒有得到足夠的關照。如果有更多的、足夠的時間去探討和理解他的疾病的話,應該會非常有幫助。在很多開發中國家,甚至都沒有很多的醫生來幫助這些病人解決問題。所以,我們想看看 AI 能怎么樣幫助解決這些問題。
這裡我想給一個比較簡單的例子,我們自己在這上面做了一些小的、比較新的探索,實際上就是讓 AI 識別胸部 X 光片。
通常人類醫生做這個過程、判斷疾病的嚴重程度非常花時間,而且它對醫生的要求也非常高。假設我們如果有一個基於 AI 的 X 光疾病識別算法,就可以極大地減少人類醫生的工作量。但這裡也有一個悖論:一方面,我們想做這樣的 AI 去幫助醫生做一些判斷,幫助醫生對疾病形成更好、更深的理解;而通常技術就是深度學習,如果我們要做這個問題的話,深度學習會需要大量的標註數據才能做出一些成果。這樣就回到了我們開始想要解決的問題:我們本來是想幫我們的人員減少他們的工作量,減少他們對數據的處理,結果我們做這些事情,反而要讓他們處理更多的數據。
我們這裡就開始在看怎么樣去解決這個具體問題。通常來說,如果我們要去獲取這種標註數據,對做標註的醫生要求是非常高的。不過其實我們有很多的 X 光圖像都是帶有醫學的報告的,這些醫學的報告來自於以往積累的真實診療記錄。我們合作研究的醫院有十多萬張 X 光圖像,然而在這么大量的圖像裡面只有小於一千張有這種帶邊界框的數據標註。我們最近一段時間對這個問題進行了一些探討,去考慮如何用深度學習的方法來解決這個問題。中間我們的 Wang Chong 博士也是對這個項目的學習算法貢獻非常大,我們想的是怎么用半監督學習,和這些小量的數據,用一個算法來極大地提高了這些少量數據的有效性。這樣的結果我們就可以不但有對這個疾病的類別的判定,同時還能給我們的一些建議,怎么樣解決這個問題。
這是一個簡單的例子去怎么看從我們如何去設計算法。在我們這個裡面,我們還有做很多的嘗試,中間包括數據收集和總體解決方案的建立。我剛才介紹到對 AI 醫療的領域,我們整個團隊也是非常感興趣。因為有很多的行業的這種合作,所以我們也會用開放的態度積極參與。用 AI 改善人們的生活是我們非常關注的問題,我們想用 AI 來對相關行業做出更多的貢獻。