沃森超級計算機

沃森超級計算機

沃森超級計算機是一台以IBM創始人托馬斯·沃森名字命名的電腦。在硬體方面,IBM Power 7系列處理器是當前RISC架構中最強的處理器——採用45nm工藝打造的Power 7處理器擁有八個核心32個執行緒,主頻最高可達4.1GHz,二級快取更是達到了32MB。而在軟體方面,IBM研發團隊為“沃森”開發的100多套算法可以在3秒內解析問題,檢索數百萬條信息然後再篩選還原成“答案”並輸出成人類語言。

基本介紹

  • 中文名:沃森超級計算機
  • 命名:創始人托馬斯·沃森名字
  • 工藝:採用45nm工藝打造
  • 特點:在3秒內解析問題
事件簡介,賽事介紹,機器簡介,賽前軼事,一台很厲害的計算機,應戰智力遊戲,參加智力遊戲,擊敗人類,沃森的未來,從“深藍”到“沃森”,

事件簡介

IBM超級計算機沃森將與人類比智力
IBM超級電腦沃森”將於2011年2月參加這檔智力競賽節目,與兩位最成功的選手展開對決。2月14日,15日和16日,這台以IBM創始人托馬斯·沃森名字命名的電腦將亮相《危險》,在兩場比賽中挑戰肯·詹寧斯和布拉德·魯特
在2004-2005賽季,詹寧斯曾連續74場贏得比賽,所斬獲的獎金總額超過250萬美元。魯特則是所有參加《危險》的選手中拿獎金最高的一位,在2002年和2005年的比賽中共拿到超過325萬美元獎金。

賽事介紹

沃森”與詹寧斯魯特的對決,冠軍獎金為100萬美元,亞軍為30萬美元,季軍為20萬美元。詹寧斯魯特將拿出一半獎金捐給慈善組織,“沃森”的獎金則將全部捐出。讓“沃森”有能力參加《危險》歷時幾年時間才最終成為現實。《危險》的很多線索隱藏在微妙的文字遊戲、反語和謎語中,其中一些挑戰對人類選手更為有利,電腦則面臨相當難度。也就是說,IBM必須教“沃森”學會思考。

機器簡介

沃森”研究小組負責人大衛·法魯西博士在一份聲明中表示:“經過4年的努力,我們的科研小組相信‘沃森’已經做好迎接這種挑戰的準備。它具備了快速領悟《危險》中出現的各種線索的能力,能夠對所獲取的信息進行分析並給出準確答案。此外,它還能在應對挑戰時樹立起信心。能夠讓‘沃森’參加比賽,我們都感到非常興奮,‘沃森’具有突破性的計算能力也讓我們信心滿滿。藉助於這種超級計算機,我們能夠構建一顆更智慧型的星球,讓我們的工作和生活更加便利。”

賽前軼事

2009年12月,弗里德曼和其他製作人員第一次見到“沃森”,當時這台超級電腦與兩名人類選手展開對決。“沃森”採用IBM POWER7伺服器,能夠將所處理的任務實現最最佳化。IBM表示參加挑戰的“沃森”必須快速處理所有任務。此外,這台超級電腦還採用了一系列專利技術,能夠讓任務和數據處理與信息實時分析同時進行。
法魯西指出《危險》的本質就是要讓技術朝著正確的方向發展。他說:“這檔節目涉及的領域很廣,會提出各種各樣的問題,是我們希望參加的挑戰之一。這項挑戰是對選手信心的一種考驗,你必須在確信答案正確後才回答,此外,你還不得不快速給出答案。”
IBM表示“沃森”採用的技術能夠在醫療衛生等很多領域發揮作用,能夠幫助提高醫生診斷病情的準確性,改進線上自助諮詢台,為遊客和居民提供相關城市的特定信息,或者通過手機為消費者提供支持。為了備戰《危險》,“沃森”曾與前《危險》冠軍展開50多次對決。此外,它還參加了《危險》節目組為所有潛在選手準備的測驗並順利通過。
《危險》監製哈里·弗里德曼稱,在IBM第一次與《危險》節目組接觸時,製作人員均產生濃厚興趣,但同時也擔心觀眾對“沃森”參加比賽產生分歧,將其視為一個噱頭或者花招。他說:“現在態度不同了。這是電腦獲取的知識與最優秀的《危險》選手獲取的知識之間的一種較量。這是一場重要的比賽,我們都希望參與其中。”

一台很厲害的計算機

沃森由90台IBM伺服器、360個計算機晶片驅動組成,是一個有10台普通冰櫃那么大的計算機系統。它擁有15TB記憶體、2880個處理器、每秒可進行80萬億次運算(這是目前的情況)。這些伺服器採用Linux作業系統。IBM為沃森配置的處理器是Power 7系列處理器,這是當前RISC(精簡指令集計算機)架構中最強的處理器。它採用45nm工藝打造,擁有八個核心、32個執行緒,主頻最高可達4.1GHz,其二級快取更是達到了32MB。存儲了大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》(World Book Encyclopedia)等數百萬份資料。每當讀完問題的提示後,"沃森"就在不到三秒鐘的時間裡對自己的資料庫"挖地三尺",在長達2億頁的漫漫資料里展開搜尋。
沃森是基於IBM"DeepQA"(深度開放域問答系統工程)技術開發的。作為"沃森"超級電腦基礎的DeepQA技術可以讀取數百萬頁文本數據,利用深度自然語言處理技術產生候選答案,根據諸多不同尺度評估那些問題。IBM研發團隊為"沃森"開發的100多套算法可以在3秒內解析問題,檢索數百萬條信息然後再篩選還原 成 "答案"輸出成人類語言。每一種算法都有其專門的功能。其中一種算法被稱為"嵌套分解"算法,它可以將線索分解成兩個不同的搜尋功能。
"沃森"超級計算機與谷歌搜尋引擎相比究竟誰更智慧型?對於這一問題,美國《商業周刊》前科技編輯史蒂芬·貝克爾近日通過分析和比較後認為,"沃森"超級計算機比谷歌更智慧型。貝克爾認為,答案很簡單,谷歌現在還不能回答問題。谷歌以兩種方式信賴於我們人類的大腦:首先,在描述用戶的查詢請求時,谷歌會讓用戶像計算機一樣去思考,挑選出三或四個最符合計算機意圖的訊息,形成一個查詢結果列表。其次,谷歌會將用戶引導到與所查詢的答案類似的答案上去,讓用戶花更多的腦力去發現所需要查詢的確切答案。而"沃森"超級計算機則是自己處理所有問題。它必須要解碼複雜的英語,窮盡所有可能的答案,並選擇其中一個,最終判定它是否足夠符合要求。

應戰智力遊戲

對計算機沃森來說,挑選出合適的語境是一項艱巨任務,尤其是在充滿暗示和惡作劇的遊戲裡,而且它還必須確定答案的可靠性以及它是不是需要冒險去猜。"沃森"需要識別人類的語言,並從中分析微妙的含義,諷刺口吻、謎語、構詞斷句、詩篇線索等等這些邏輯和線索,並通過一系列的數據比對和模擬人類的聯想能力得出精準的答案,再反向用人類的語言回答出來。此外,沃森還能模仿人類針對問題進行策略考慮,例如問題的挑選、是否略過不擅長的題目,還會模仿人類的口吻搞笑整個過程僅有計算機和軟體算法完成,沒有工程師參與(這種快速問答,其實也參與不了),也與網際網路斷開因此計算機不能作弊,必須自己"想"。
領導設計"沃森" 的IBM 研究團隊的科學家David Ferrucci 博士表示:"經過四年的努力,我們的科學團隊相信"沃森"已經能夠快速理解《危險邊緣》問題的內容,分析它需要獲得的信息,得到精確的答案,並給出可信的回答。""沃森"會估計《危險邊緣》節目組剩下的獎金數額、自己比其他對手落後或領先多少、自己在特定類別的題目上的表現,及時調整自己的信息級別。如果"沃森"落後對手太多,它的信心級別會較低,例如40%,這時它仍會繼續努力;不過在領先對手時它也會想:"我已經領先那么多了,為什麼還要冒險呢?"因此,即使它的信心值是75%,它也有可能會選擇不回答。
在開發"沃森"的四年間,研發團隊主要以兩種方式評估這套系統。首先,他們以成批的方式(如每次3000個問題)進行大規模測試以評估系統性能,實施錯誤分析,提高系統性能。基於這種多問題的表現可以從統計學角度作出重要的性能評估;其次,該團隊評估"沃森"的第二個方式是,與《危險邊緣》以前的參賽選手進行"陪練"比賽。在2009年冬天,他們與曾經出現在《危險邊緣》的選手進行了79場比賽,在剛剛過去的秋天,沃森與獲得過《危險邊緣》比賽冠軍的選手進行了55場對決。這些陪練比賽讓研發團隊對沃森的性能有了深入認識。

參加智力遊戲

危險邊緣》是哥倫比亞廣播公司益智問答遊戲節目,已經經歷了數十年歷史。該節目的比賽以一種獨特的問答形式進行,問題設定的涵蓋面非常廣泛,涉及到歷史、文學、藝術、流行文化、科技、體育、地理、文字遊戲等等各個領域。根據以答案形式提供的各種線索,參賽者必須以問題的形式做出簡短正確的回。與一般問答節目相反,《危險邊緣》以答案形式提問、提問形式作答。參賽者需具備歷史、文學、政治、科學和通俗文化等知識,還得會解析隱晦含義、反諷與謎語等,而電腦並不擅長進行這類複雜思考。
沃森的設計初衷則是要理解更為複雜的詞句、語言和人類知識。IBM科學家、沃森團隊的負責人大衛·費魯奇(David Ferrucci)表示,利用《危險邊緣》去開發計算機系統"將推動技術向正確的方向發展"。他表示: "節目會問各種問題。這同時涉及到信心,當你認為你的答案不正確時不要回答。你還需要很快地做出判斷。"IBM表示,贏得《危險邊緣》比賽並不是主要目的。通過沃森的技術,醫生可以更快地診斷病例,法律工作者也可以更快地研究案例。《危險邊緣》執行製片人哈里·弗里德曼(Harry Friedman)表示:"這些很重要,我們希望成為其中的一部分。"

擊敗人類

台北時間2011年2月17日,人機大戰最終成績出爐:電腦沃森狂勝人類。由IBM和美國德克薩斯大學聯合研製的超級電腦沃森”(Watson)在美國最受歡迎的智力競猜電視節目《危險邊緣》中擊敗該節目歷史上兩位最成功的選手肯-詹寧斯和布拉德-魯特,成為《危險邊緣》節目新的王者。
在第三天的比賽中,IBM的超級電腦沃森獲得了41413美元的分數,而兩位人類選手肯·詹寧斯(Ken Jennings)和布拉德·拉特(Brad Rutter)分別僅獲得了19200美元和11200美元。
將三個比賽日的成績相加即可得出最後的總成績,沃森也是大幅領先於人類,最終成績上,沃森達到了77147美元,肯·詹寧斯排名第二,但只獲得了24000美元,而布拉德·拉特獲得了21600美元,排名第三。
在第三比賽日的比賽中,沃森一路領先,以至於在進入最終的Final Jeopardy環節前,人類選手超過沃森的幾率已經幾乎不存在了。
在Final Jeopardy中,排名第二的肯·詹寧斯已經放棄追趕沃森,而選擇保住第二的位子,因此他僅賭了1000美元,排名第三的布拉德·拉特則放手一搏,壓上了他所能賭的最大賭注——5600美元,而沃森再一次暴露了他是非人類的本質,賭了17973美元,這和人類正常賭的整數大相逕庭。

沃森的未來

美國哥倫比亞大學醫療中心和馬里蘭大學醫學院已與IBM公司簽訂契約,兩所大學的醫療人員將利用沃森更快、更準確地診病、治病。它的海量信息庫中存有許多發表在期刊上的專業論文,可以讓醫生利用最新科研成果治療病人。
想要讓沃森真正成為醫生的得力助手,還需要對它進行改進。醫生需要的不只是一個答案。而且有時病人提供的信息不準確或相互矛盾,這就需要醫生利用豐富的經驗進行判斷。IBM研發小組接下來的挑戰是,讓沃森多提供一些假設情況,研發小組至少還需要兩年才能完成這一任務。

從“深藍”到“沃森”

?14年前,IBM研發的計算機“深藍”(Deep Blue)戰勝了西洋棋冠軍卡斯帕羅夫;現在,這家公司以創始人Thomas J. Watson名字命名的計算機,繼續著對人類智慧型極限的挑戰。
IBM長於製造各種複雜的機器,除了伺服器還有這種智慧型計算機(小型機的集群),它看起來可不僅僅就像那句有點諷刺意味的流行語說的那樣—IBM,不是個生產哲學的公司嗎?
在1960年代人工智慧的技術研發停滯不前數年後,科學家便發現如果以模擬人腦來定義人工智慧那將走入一條死胡同。現在,“通過機器的學習、大規模資料庫、複雜的感測器和巧妙的算法,來完成分散的任務”是人工智慧的最新定義,這早已經取代了曾經甚囂塵上的“重建大腦”。
按照這個定義,沃森人工智慧上被認為又邁出了一步。“深藍只是在做非常大規模的計算,它是人類數學能力的體現,”IBM中國研究院資深經理潘越告訴《第一財經周刊》,他同時參與沃森項目,負責提供數據支持。“當涉及到機器學習、大規模並行計算、語義處理等領域,沃森了不起的地方在於把這些技術整合在一個體系架構下來理解人類的自然語言。”
如果這些解釋有點晦澀難懂的話,那么可以參看一下《危險邊緣》的遊戲規則,你便知道沃森的價值何在。
《危險邊緣》是哥倫比亞廣播公司一檔長盛不衰的電視問答節目,自1964年開始播出,最精彩的地方在於遊戲裡的問題包羅萬象,幾乎涵蓋了人類文明的所有領域。它的規則是答對問題可以獲得獎金,答錯就會倒扣。
對人類來說,規則很簡單,但對沃森來說,則意味著眾多挑戰。首先沃森必須要聽懂主持人的自然語言,這是深藍不具備的;其次是沃森需要分析這些語言,比如哪些是反諷,哪些是雙關,哪些是連詞,隨後根據關鍵字判斷題目的意思,沃森進行相關搜尋,並評估各種答案的可能性;最後選擇三個可能性最高的答案,當其中一個可能性超過50%後,程式啟動,沃森按下搶答器。
這些得以實現靠的是90台IBM伺服器、360個計算機晶片驅動以及IBM研發的DeepQA系統。IBM為沃森配置的處理器是Power 750系列處理器,這是當前RISC(精簡指令集計算機)架構中最強的處理器—這些得以支持沃森最終得出可靠答案的時間不超過3秒鐘。
沃森主打的是小型機的並行運算。IBM在大型機上的地位很難撼動—在小沃森(創始人老沃森的兒子)執掌IBM時期,IBM投入約60億美元,這筆超過當年NASA的研發經費,最終把日本的NEC與法國的克雷排擠出去,奠定了IBM在大型機市場的壟斷地位。
“在IBM的內部員工培訓上流傳著一句笑話,那便是在大型機領域,有97%的市場份額來自IBM,剩下的3%來自淘汰的IBM二手大型機。”IBM伺服器銷售部門前負責人告訴《第一財經周刊》。
IBM試圖把大型機上的優勢帶入到小型機領域。沃森主打的正是IBM的銷售新星90台小型機的並行運算,“IBM小型機的運算速度是突出的,”上述IBM員工評價說,“因為它把大型機的CPU研發優勢直接移植到小型機上來了。”
IBM是為數不多的可以有能力獨立開發小型機CPU的廠家,IBM還將這些技術出售給了除英特爾以外的晶片製造商。
現在,在小型機市場上,IBM與HP的市場比例大致為2:1,另外一家小型機公司SUN則現在主要針對低端市場。
此外,IBM的全球研發團隊的某種模式也加大了沃森贏得比賽的可能。
這些團隊分工極為細緻,比如以色列海法團隊負責深度開放域問答系統工程的搜尋過程,日本東京負責沃森在問答中將詞意和詞語連線,IBM中國研究院和上海分院則負責以不同的資源給沃森提供數據支持,還有專門研究算法的團隊以及研究策略下注的博弈團隊等。
“我們就好像是每個不同的虛擬部隊,每個人只做自己最擅長與熟悉的那部分。”潘越稱。
事實上這便是IBM的特色,它一直遵循工業時代的成功模式,比如這種製造企業更為擅長的流水線模式,並且通過給員工分級打分的獎懲制度,讓它的各個團隊都更有效率。
這些研發天才開發的DeepQA系統保證了沃森可以具備嶄新的人機互動模式,比如可以理解並分析自然語言,事實上,對自然語言的理解也一直是IBM研究機構在人工智慧上的強項。
這很像科幻電影裡的橋段—為了隱秘的機器人開發計畫,在全球招募天賦異秉的人士。所不同的是,IBM的意義顯然更為實際。
此前,基於深藍研發的AIX作業系統讓IBM在商業運用與政府部門中取得了大量的訂單,IBM也希望可以將沃森的DeepQA系統運用於醫療服務、諮詢等領域之中。
沃森的優勢是給出準確與可靠的答案,因此可以為醫生提供更適合病人的解決方案。“潘越稱,“在醫療領域的套用將是沃森商用最主要的領域。”
沃森項目如果想在醫療行業推行的話,還需要面臨法律層面的問題,IBM一位研究員稱,“如果沃森診斷出錯,而醫生又聽從了錯誤的診斷,那么沃森就會面臨被患者告上法庭的危險,這對IBM而言是一個正在考慮的套用問題。”
對於IBM來說,沃森未來不僅要繼續挑戰人類智慧型的極限,還要幫助這家公司去同亞馬遜、谷歌、微軟們競爭,爭奪未來科技制高點的主導權。

相關詞條

熱門詞條

聯絡我們