浙江大學漢語史中心漢語信息處理研究室

浙江大學漢語史中心漢語信息處理研究室的研究領域覆蓋漢語言文字學、中國古典文獻學、計算機科學等幾個博士點,有利於各種知識的交匯融合,有利於古今漢語的溝通。漢語信息處理研究室從事於計算機漢語信息處理和語料庫建設。計算機信息處理方面,以周昌樂教授為首的課題組正在進行人機對話,手寫漢字的機器識別,運用計算機提取、編制語言特徵識別軟體,及對疑偽佛經、小說的作者和年代等語料進行鑑別考證工作。

基本介紹

  • 中文名:浙江大學漢語史中心漢語信息處理研究室
  • 主管部門:浙江大學漢語史中心
研究方向,科研條件,科研成就,

研究方向

漢語信息處理研究

科研條件

第一,投入專項經費,儘快建立專門的電腦室,把中古近代漢語語料庫建立起來;第二,力爭儘快地引進這方面的專門人材,已經有目標;第三,在三年內為計算機信息處理設立一個重大課題。本領域是一個發展前景極為廣闊的天地,我們還剛剛起步,今後定將投入比較多的人力和物力,優先予以發展。

科研成就

周昌樂的《手寫漢字的機器識別》、《無心的機器》等著作就是作者在信息處理理論方面的積極探索。本中心策劃組織的敦煌文獻資料庫建設計畫已正式啟動。香港年代公司為本項目的第一期工作提供了50萬元的經費資助。估計該資料庫總字數將達八千萬左右。錄入資料庫的敦煌文獻將按傳統的四部分類法整理編排。整理工作包括定名、解題、錄文、校勘等項。經精心整理校勘的錄文輸入電腦後,將編制編號、書名、卷名、字詞等多種檢索程式,再配以原件的圖版,以增加可信度,圖(敦煌寫卷)文(經過標點整理的錄文)對照,為學術界提供一套校錄精確、查閱方便的敦煌文獻的查閱檢索系統。整個資料庫既將製成光碟出版發行,還將建立敦煌文獻多媒體可視化網站,供全世界研究人員和感興趣的公眾查詢和使用,從事敦煌學研究的各國學人(包括利用敦煌資料的學者),將能化費不多的錢而擁有一整套敦煌文獻,並且圖文對照,檢索便捷,從而使珍貴的敦煌卷子從圖書館走進學者的書房,使敦煌文獻成為世界學人在書房中即可利用的材料。這對於促進敦煌學研究的深入和普及,使敦煌學在新的世紀取得更大的輝煌,將發揮巨大的作用。另外,本中心擬建設中古近代漢語語料庫;並已和美國、挪威、日本、台灣、香港等地的有關院校和學者達成了交換共享語料的協定,也和四川大學、湖南師範大學、上海師範大學等有關單位達成了類似的協定,和上海師大的任海波等從事計算語言學研究的學者也有比較多的聯繫。

相關詞條

熱門詞條

聯絡我們