黃昌寧

黃昌寧

黃昌寧,1937年生於廣東,1955年考入清華大學電機系,1961年畢業並留校任教至博士生導師, 1983-1984年赴美國耶魯大學進修,1986-1987年曾在香港理工大學任教,1999年4月加入微軟中國研究院任主任研究員。中國計算機自然語言處理領域的"趟路人"和集大成者。

基本介紹

  • 中文名:黃昌寧
  • 出生地:廣東
  • 出生日期:1937年1月 
  • 畢業院校:清華大學
人物生平,人才培養,挑戰權威,獻身科研,受聘微軟,躊躇滿志,

人物生平

男,1937年1月出生於廣東。1961年畢業於清華大學自動控制專業,畢業後留校任教至今。現任計算機系教授、博士生導師。1978年起從事人工智慧和自然語言理解的教學科研工作。
1955年,年僅十八歲,風華正茂的黃昌寧以優異的成績考入清華大學電機系,在這裡,一批卓有成就的教授讓他受益菲淺,其中自動控制系的首任系主任、麻省理工大學的博士鐘士模教授給他留下的印象尤為深刻。黃昌寧所學的專業是清華大學在國內率先建立的計算機和自動控制專業,當時是按照國防部門的要求來招生的,學生畢業後大多從事飛彈、原子能反應堆和加速器控制系統的研究和設計。畢業後黃昌寧的大多數同學都去了軍工行業,他則選擇了留校擔任助教。
在70年代,黃昌寧曾因主編大學教材《電晶體電路》而成為揚名清華的教授,該書在國內的發行量逾百萬冊。隨後,他的譯著《人工智慧原理》及《LISP語言》填補了當時國內的空白,引起了很大的反響。進入自然語言處理研究領域後,黃昌寧的事業又達到了一個新的高峰。他開始主持自然語言處理領域的多項國內、國際合作項目,並多次被邀擔任國際學術會議的主席或程式委員會主席,或作大會特邀報告;目前黃昌寧還擔任國內《中文信息學報》的主編,同時也是美國《ACM亞洲語言信息處理專刊》、新加坡《中文與東方語言信息處理學會通訊》、日本《自然語言處理》、香港《中國語言學評論》、台灣《計算語言學與中國語言處理》等眾多國際學術刊物的特約撰稿人和編委。

人才培養

清華大學計算機系的黨委書記孫茂松教授以及周明都是黃昌寧的學生。

挑戰權威

"我有一個信念,自己想做的事就要做得比人家都好。就像我當年打排球和棒球一樣,一到賽場必然問自己:我乾什麼來了?就是要贏嘛!"黃昌寧一直這樣說。
1983年黃昌寧遠赴美國耶魯大學進修,主攻人工智慧和自然語言理解方面的研究。黃昌寧後來回憶說,耶魯大學的那一年對他一生所從事的研究是一個很重要的轉折。他說,他並不是為學位而去讀書的,而是出去看看國外的研究是怎樣做的,又是如何進行評價的。
當時的耶魯大學計算機系系主任尚克教授是美國人工智慧學會的主席,從事自然語言理解的研究已有十多年歷史,是80年代初美國這一研究領域中的權威,他倡導的概念依存理論當時正處於鼎盛時期,曾經得到學術界許多人的推崇。尚克認為他已經把計算機、語言學、認知心理學等各個學科結合得非常好了。在對尚克的一片贊同聲中,黃昌寧卻表現得相當冷靜,只想看看尚克的語言理解系統能否 "長大"。因為他清醒地認識到,大學實驗室里的研究和現實生活有時會有很大的差別。他很快就發現了尚克理論的一些缺陷。尚克認為計算機對自然語言的分析幾乎可以不要句法就直接進入語義解釋。黃昌寧經過對尚克系統的仔細考察,發現他的學說雖然可以在某個特定領域裡實現,但一旦擴展到其它套用領域時就困難重重了。"問題的關鍵是,我們的系統不能只是在實驗室里表演,重要的是能夠真正擴展開來!"黃昌寧堅持說。
黃昌寧認為,計算機對自然語言的分析首先要在辭彙和句法上得到認知,然後才能獲得意義的表達,尤其對於大規模真實文本的處理更是如此。他舉了一個例子,比如設計一個氣象預報的機器翻譯系統,肯定能做好,因為這個領域裡的辭彙大概只有500多條,而且大多是地名和少量常見動詞,譯準率會很高。但是要做一個一般用途的機器翻譯系統就難了,因為這包括太多的辭彙和語法現象。黃昌寧的觀點後來得到證實:80年代末,尚克學派宣告解體,尚克本人也退出了自然語言研究領域。

獻身科研

1984年3月,黃昌寧結束了在耶魯大學的進修,按時返回國內,從此就再也沒有閒下來。
80年代初,自然語言處理研究在國內還幾乎是個空白,比美國則落後了二十年。黃昌寧把這門學科的思想帶回中國,其中心是如何通過計算把一句話的意思或一段話的內容用某種形式化的方式表示出來,這種表示就是所謂的語義網路。這時黃昌寧體會到自然語言處理實際上就是建立在計算機基礎上的語言研究,他深感自己所缺乏的並不是計算機方面的知識,而是語言學知識。因此回國以後他開始和語言學家們進行廣泛交流。除了尚克的概念依存理論,黃昌寧回國後還先後涉足了其它先進技術的研究,其中包括複雜特徵集和合一語法及統計語言模型等。
1985年,黃昌寧同時挑起了三副擔子,一是"七五”國家攻關項目-自然語言理解和人機接口;二是國防預研項目—軍事文本理解技術;三是清華大學和南京大學合作的"日漢機器翻譯系統",該項目後來獲得國家教委科技進步二等獎。不久黃昌寧開始將目光投向海外,80年代末他相繼主持了幾個國際合作項目:第一個是日本富士通公司的阿特拉斯日漢翻譯系統,當時富士通公司已經有了英日翻譯,但是漢語的翻譯是他們無法迴避的問題,黃昌寧和他的研究隊伍經過三年努力成功完成了這項研究。1990年,日本通產省投資5000萬美金開發亞洲多國語言機器翻譯系統,該系統涵蓋了日、中、馬來、印尼和泰等五種語言。這個翻譯系統採用國際上先進的 "中間語言" 技術。中間語言是句子意思的一種形式化表示,通過它可以生成任何一種語言。上述五個亞洲國家參與了這個項目,中文部分由當時的電子部來承擔,黃昌寧則擔任中方專家組組長和中方技術負責人。1995年,黃昌寧又代表清華大學和DEC公司進行了英漢翻譯的科研項目。他領導的清華小組還曾多次向微軟和IBM等公司有償轉讓一些科研成果。

受聘微軟

1998年秋,當時微軟中國研究院正處於建院之初,求賢若渴的院長李開復博士在香港約見了正在香港大學講學的黃昌寧,動員他加盟微軟中國研究院。兩人第一次見面,就談到自然語言處理研究的前景和微軟的發展機會。兩人談得十分投機,都有相見恨晚的感覺。"士為知己者死",黃昌寧引用了這句話。1999年4 月,他走進微軟中國研究院時已年逾六旬,是研究院裡年齡最大的研究人員,當時研究人員的平均年齡只有30歲。黃昌寧說科學研究要有一個開放的環境,微軟研究院的環境正是如此,這正給他提供了一個實現自己宿願的機會。黃昌寧特別欣賞比爾·蓋茨對未來計算的一個想法,那就是有一天能夠讓計算機用自然語言與人類進行交流。他說:“這正是自然語言研究的最終目標,而且微軟將最有可能使我們的研究成果轉化成產品,造福世界上成千上萬的用戶。”目前,黃昌寧領導的研究小組專注於三個研究課題:一是幫助中國用戶寫英文;二是幫助中國用戶閱讀英文;三是幫助中國用戶做跨語言的網頁搜尋。黃昌寧希望前兩項技術能夠儘快被微軟產品部門接受,成為微軟下一代OFFICE軟體中的一個組件。
黃昌寧的研究很快在理論上也得到認可。在自然語言研究領域,最權威的學術會議是國際計算語言學學會(ACL)年會,其論文錄取率不足25%。但2000年 10 月,在香港召開的第38屆ACL年會上,黃昌寧領導的研究小組卻有6篇論文入圍。在大會所接受的70篇論文中,其質量和規模都引起了廣泛關注。

躊躇滿志

信息抽取是近年來美國國防部關注的一個研究方向,目的是直接從報紙或網頁的自然語言文本中抽取出指定信息以幫助人們在某些領域對事態的發展動向作出判斷並制定相應策略。這樣的研究在經濟領域和國家安全保障方面都有重要的套用前景。黃昌寧認為網路時代處理最多的仍然是語言文字信息。人工智慧的某些領域可能正在衰亡,但是自然語言的研究不會萎縮。
他還認為:大規模真實文本的處理是自然語言研究領域的一個重要方向,主流技術不是傳統的語言學方法,而是語料庫方法。語言學和套用聯繫密切,其發展必須要靠社會需求的驅動,不是哪一個人所能決定的。現在的數字圖書館和搜尋引擎都是同大規模文本打交道的實例。
黃昌寧領導的研究小組正在有條不紊地推進他們的研究課題,黃昌寧希望自己的小組能夠創造出更多世界一流的語言信息技術,使得人們能夠在網路時代更輕鬆自然地使用計算機。

相關詞條

熱門詞條

聯絡我們