在谷歌雲,我們有非常非常多的傳統的行業跟我們進行合作,我們在跟他們交流的過程或者溝通的過程,發覺有好多的問題,我們整個 AI 領域還沒有給予特別多的關注,比如說其中一個就是 AI 醫療。
我們知道醫療技術裡面,實際上有很多非常非常有意思的問題,比如說我們的醫生資源非常少,特別是中國,一個醫生一天看上百人的病人,我覺得這對醫生來說是非常繁重的勞動,而且病人也沒有得到足夠的關照。如果有更多的、足夠的時間去探討和理解他的疾病的話,應該會非常有幫助。在很多開發中國家,甚至都沒有很多的醫生來幫助這些病人解決問題。所以,我們想看看 AI 能怎么樣幫助解決這些問題。
這裡我想給一個比較簡單的例子,我們自己在這上面做了一些小的、比較新的探索,實際上就是讓 AI 識別胸部 X 光片。
通常人類醫生做這個過程、判斷疾病的嚴重程度非常花時間,而且它對醫生的要求也非常高。假設我們如果有一個基於 AI 的 X 光疾病識別算法,就可以極大地減少人類醫生的工作量。但這裡也有一個悖論:一方面,我們想做這樣的 AI 去幫助醫生做一些判斷,幫助醫生對疾病形成更好、更深的理解;而通常現在的技術就是深度學習,如果我們要做這個問題的話,深度學習會需要大量的標註數據才能做出一些成果。這樣就回到了我們開始想要解決的問題:我們本來是想幫我們的人員減少他們的工作量,減少他們對數據的處理,結果我們做這些事情,反而要讓他們處理更多的數據。
我們這裡就開始在看怎么樣去解決這個具體問題。通常來說,如果我們要去獲取這種標註數據,對做標註的醫生要求是非常高的。不過其實我們有很多的 X 光圖像都是帶有醫學的報告的,這些醫學的報告來自於以往積累的真實診療記錄。我們合作研究的醫院有十多萬張 X 光圖像,然而在這么大量的圖像裡面只有小於一千張有這種帶邊界框的數據標註。我們最近一段時間對這個問題進行了一些探討,去考慮如何用深度學習的方法來解決這個問題。中間我們的 Wang Chong 博士也是對這個項目的學習算法貢獻非常大,我們想的是怎么用半監督學習,和這些小量的數據,用一個算法來極大地提高了這些少量數據的有效性。這樣的結果我們就可以不但有對這個疾病的類別的判定,同時還能給我們的一些建議,怎么樣解決這個問題。
這是一個簡單的例子去怎么看從我們如何去設計算法。在我們這個裡面,我們還有做很多的嘗試,中間包括數據收集和總體解決方案的建立。我剛才介紹到對 AI 醫療的領域,我們整個團隊也是非常感興趣。因為有很多的行業的這種合作,所以我們也會用開放的態度積極參與。用 AI 改善人們的生活是我們非常關注的問題,我們想用 AI 來對相關行業做出更多的貢獻。