西南民族大學民族語言文字信息處理技術研發中心是西南民族大學下屬研究機構。
基本介紹
- 中文名:西南民族大學民族語言文字信息處理技術研發中心
- 所屬機構:西南民族大學
一、中心發展概況
1994年學校成立了民族文字信息處理研究所,2002年成立民族語言文字信息處理實驗室(四川省高校重點實驗室),2012年在此基礎上建立了民族語言文字信息技術研發中心,目前包括民族文字信息處理研究所、民族語言文字信息處理實驗室、中國西南少數民族語言資源庫建設基地(與中國社會科學院共建)等科研與信息平台;全國彝語術語標準化工作委員會、全國高等院校彝漢雙語教材編譯審定委員會、四川省民族語言研究所也掛靠中心建設與管理。中心先後3次獲總計1080萬的國家財政部中心專項建設經費建設支持。在著名語言文字信息處理專家沙馬拉毅教授的帶領下,中心中心長期致力於民族語言信息化的研究與教學工作,在民族語言文字信息處理領域(彝、藏、傣、納西、羌、花瑤)已取得了一系列具有開拓性的研究成果,相關成果填補了國際、國內空白,在國內外學術界產生了較大影響,為民族語文工作的現代化、信息化的全面開展提供了強有力的技術支撐,現已成為全國具有著鮮明學術特色的民族語言信息處理化技術的研發基地、人才培養基地。
2016年11月中心因各項工作落實到位、成效突出被學校遴選為“共產黨員示範團隊”;2017年9月榮獲2016—2017學年西南民族大學民族團結進步先進集體榮譽稱號。
中心在學校特色、優勢學科-中國少數民族語言文學專業(藏、彝)的基礎上,相繼開設了民族語言文字信息處理碩士研究生專業和本科專業,形成了較為完整的專業人才培養體系。
二、中心建設與研究目標
堅持為民族地區信息化建設、發展服務的宗旨,根據學校一體兩翼發展規劃,堅持走特色、內涵發展的道路,在民族語言信息處理、民族語言語料庫、民族古籍文獻的信息化建設、民族語言移動設備信息處理研究等領域開展交叉研究和創新實踐中,與民族地區信息化建設、文化傳播、文化資源庫建設等社會現實需求緊密結合;同時結合中心的特色優勢,把中心工作與信息化時代民族語言與傳統文化的發展、傳播與傳承創新結合起來,探索民族傳統文化的發展及其在大數據時代的保護、傳承的理論與技術支撐;積極推進民族文化的數位化研究進程,通過形式新穎、凸顯特色、主題鮮明的信息化研究成果,來立體化呈現、弘揚、傳承優秀的民族傳統文化。
三、中心研究工作進展
中心在民族文字信息處理技術研究方面取得了科研成果60餘項,完成國家自然科學基金項目1項;完成國家社會科學基金項目2項;主持制定了信息處理國家標準3項,國際標準1項;獲國家專利1項;完成省部級科研項目12項;完成合作開發項目6項;完成省部級以下項目26項;發表相關學術論文數100餘篇;獲省部級以上教學科研成果獎勵9項。目前在研國家社科基金重大項目1項,國家社會科學基金重大專項子課題1項,省部級科研項目4項,廳局級項目6項。
1、主要科研項目
(1)《中國彝文古籍文獻整理與保護及其數位化建設》,國家社科重大招標項目,在研;
(2)《彝文信息處理及標準彝文字元集與編碼的研製》,國家自然科學基金項目,完成;
(3)《彝語語料庫的研究與建設》,國家社會科學基金項目,完成;
(4)《漢彝對照標註詞庫的建設》,國家社會科學基金項目,完成;
(5)《高校彝漢雙語教材數位化建設》,教育部項目,在研;
(6)《彝漢雙語教材建設與雙語人才培養研究》,教育部項目,在研;
(7)《彝語聲學參數資料庫的研究與建設》,教育部項目,完成;
(8)《彝族傳統醫藥術語整理及規範》,教育部項目,完成;
(9)《彝語人名漢字音譯轉寫規範》,教育部項目,完成;
(10)《彝語常用術語漢字轉寫規範標準研製》,教育部項目,完成;
(11)《藏、彝文全文獻資料庫》,國家民委項目,完成;
(12)《彝族研究文獻資料庫》,國家民委項目,完成;
(13)《信息處理用規範彝文分詞系統的設計與實現》,國家民委項目,完成;
(14)《少數民族語言水平測試標準研究(彝語文)》,國家民委項目,完成;
(15)《彝文文獻資料庫》,四川省社科規劃項目,完成;
(16)《羌語語音數位化資源庫建設》,四川省社科規劃項目,完成;
(17)《中國小教材漢彝對照電子詞典》,四川省教育廳科研項目,完成;
(18)《彝族史詩《勒俄》(四川省甘洛縣)》國家社會科學基金重大專項子課題,在研;
(19)《彝語方言綜合資源資料庫的建設研究》,教育部項目,在研;
(20)《彝語方言基礎辭彙綜合語料庫的研究與建設》,國家民委重點研究基地重點項目,完成;
(21)《彝語方言綜合資源庫的建設研究》,四川省社科項目;在研;
(22)《通用彝文規範方案認知度及現行字型檔使用情況調查研究》,教育部項目,在研。
2、主要科研成果
(1)《YWIN彝文系統》;
(2)《ZWIN藏文系統》;
(3)《DWIN傣文系統》;
(4)《中國小教材漢彝對照電子詞典》;
(5)《基於滇川黔桂古彝文系統》;
(6)《彝語元音聲學參數庫》;
(7)《通用彝文系統》;
(8)《彝文智慧型輸入系統》;
(9)《藏文智慧型輸入系統》;
(10)《納西東巴文輸入系統》;
(11)《彝語基礎例句語料資料庫》;
(12)《彝語分詞、詞性標註加工規範》;
(13)《漢彝對照詞性標註系統》;
(14)《信息處理用彝、漢語平行語料庫》;
(15)《彝語自動分析系統》;
(16)《彝語六大方言語音庫》;
(17)《中國彝文典籍譯叢電子多媒體光碟》;
(18)《跟我學彝語多媒體教學軟體》;
(19)《規範彝文字詞頻統計系統》;
(20)《彝語自動分析系統》;
(21)《彝語基礎例句語料資料庫》;
(22)《彝語分詞、詞性標註加工規範》;
(23)《方正unicode彝文系統》;
(24)《方正彝文書版系統》;
(25)《彝、藏文手寫手機》;
(26)《彝、藏文智慧型手機》;
(27)《彝、藏、傣語言學習平台》;
(28)《花瑤語音資源庫》;
(29)《藏語爾蘇語音資料庫》;
(30)《藏語嘉絨語音資料庫》;
(31)《藏語動詞一詞多義語料庫》;
(32)《彝語線上語料庫》;
(33)《彝文手寫識別技術》。
研製的計算機彝文輸入法被套用於計算機彝文雷射照排系統,填補了我國少數民族信息處理的一項空白,被兩院院士王選命名為“沙馬拉毅輸入法”;2003年“計算機彝文輸入碼及其鍵盤”獲國家專利;2005年研製出的“中國小漢彝對照電子詞典”和“藏、彝文文獻全文資料庫研究與開發”均填補了國內相關方面的空白;2006年西南民族大學與北大方正合作開發的UNICODE彝文系統問世,計算機彝文字型從開始的2種發展到現在的白體、黑體、細黑體、宋體、仿宋體、綜藝體、圓頭體、手寫體等8種字型;2007年西南民族大學與北大方正合作研發的彝文書版研發成功;2008年完成了“彝語六大方言語音庫”的建設;2008年研製出的“彝漢雙語平行語料庫和術語庫”是第一個針對彝語和漢語的平行語料庫和術語庫。2009年研製出的“彝語語料庫”是第一個大規模的彝語語料資源庫;2009年西南民族大學與中國社會科學院民族學與人類學所合作“彝語聲學參數資料庫”的研製成功,開創了彝語實驗語音學研究的先河,也為西南少數民族語言實驗語音學研究工作的開展進行了有意義的探索;2009年研製成功基於展訊平台藏、彝文手寫機被譽為“藏、彝語文發展進程中的里程碑”,使歷史悠久的藏、彝族傳統文化與移動通信技術相結合,2012年又升級為藏、彝文安卓智慧型手寫手機,為藏、彝語言文字向科技化、信息化邁進開闢了一條新路。2010年彝漢雙語詞語標註語料庫、彝漢人名漢字音譯資料庫、彝族傳統醫藥術語資料庫;2011年彝、漢、英三語平行語料庫、通用彝文系統;2012年彝文智慧型輸入法、藏文智慧型輸入法、藏文拉丁轉寫方案;2013年3月完成藏語爾蘇語音資料庫、納西東巴文智慧型輸入系統;2014年-2016年開始藏語嘉絨語音庫、花瑤語音庫、藏、彝、傣民族語言學習平台的研發,為少數民族語言實驗語音學研究工作的進一步開展奠定了豐富的語言數據基礎;2017年完成的彝文手寫識別技術的研發,推進彝語言文字進入現代信息智慧型處理領域的步伐。
這些研究成果的完成、推出都為相應民族語言文字信息處理技術的發展奠定了一個堅實的基礎。而且,這些科研成果已相關領域得到廣泛套用,為民族語文工作的現代化、信息化的全面開展提供了強有力的技術支撐。
3、科研成果獲省部級及以上獎項
(1)《信息交換用彝文編碼字元集》,獲四川省人民政府第六次哲學社會科學優秀科研成果三等獎;
(2)《計算機信息處理彝文輸入編碼》,獲四川省人民政府科技進步三等獎;
(3)《計算機彝文信息處理》,獲第五屆中國民族圖書獎二等獎;
(4)《計算機彝文字輸入方法》,獲第五十一屆尤里卡世界發明博覽會金獎;
(5)《計算機彝文信息處理》,獲四川省第十次哲學社會科學優秀成果獎三等獎;
(6)《四川民族地區少數民族語言文字套用的調查報告》,獲國家民委社會科學研究成果獎調研報告三等獎;
(7)《計算機彝文信息處理系統及系列研究成果》,獲錢偉長中文信息處理科學技術獎二等獎;
(8)《彝語言文學專業的多語言教學與實踐》,獲得四川省人民政府教學成果一等獎;
(9)《彝語語料庫的研究與建設》,獲四川省第十六次哲學社會科學優秀成果獎二等獎。
(10)《彝文古籍經典選譯(1-3卷)》,獲四川省第十七次哲學社會科學優秀成果獎三等獎。
四、人才培養
中心在學校少數民族語言文學相關專業的基礎上,相繼開設了民族語言文字信息處理碩士研究生專業和本科專業,在學校民族學博士學開設了計算機民族文字信息處理課程,在藏學學院、彝學學院開設了民族語言文字信息處理技術本科課程,形成了較為完整的專業人才培養體系,總計培養碩士研究生38人(涵蓋漢、藏、彝、白、苗等多個民族),其中畢業33人,2人獲國家級獎學金,6人獲校級優秀研究生、畢業生,現已成為民族語言信息處理化建設人才培養基地。
五、社會服務
1、中心一直在推進民族地區的信息化標準的建設,主持制定了計算機彝文信息處理國家標準3項,國際標準1項,特別是依託全國彝語術語標準化工作委員會,先後完成了《通用規範彝文》、《彝族傳統醫藥術語整理及規範》、《彝語人名漢字音譯轉寫規範》等規範的制定,為彝語文的規範化、標準化提供了依據,也為彝語文的套用和推廣起到了積極的引導作用。
2、中心研究工作與社會需求相一直結合緊密,研發的藏、彝、傣文手機、民族語言學習平台(藏、彝、傣、花瑤),被譽為“藏、彝語文發展進程中的里程碑”,使歷史悠久的藏、彝族傳統文化與移動通信技術相結合,為藏、彝、傣等民族語言文字向科技化、信息化邁進開闢了一條新路,把藏、彝、傣語言文字的現代化傳播手段帶進了現代化的通訊時代。
3、完成的“彝語語料庫”、“彝漢雙語對照辭彙語料庫”是第一個大規模的彝語語料資源庫,為彝語言教學、信息處理、科學研究等多方面提供豐富、翔實的語言數據。
4、完成的藏語嘉絨語音資料庫、羌語語音資料庫、藏語爾蘇語音資料庫、花瑤語音資料庫,為少數民族語言實驗語音學研究工作的進一步開展奠定了豐富的語言數據基礎。
5、完成的彝文手寫識別技術是彝族文化發展事業中的一件大事,標誌著彝語言文字進入現代信息智慧型處理領域,將會有力地推動彝族文字和傳統文化的保護和發展。
中央政治局常委、中央書記處書記、劉雲山,中國中央政治局委員、中宣部部長劉奇葆,國家民委副主任陳改戶、原四川省副省長張作哈、原國家民委副主任吳仕民等參觀了中心或會見了中心負責人,並對中心的科研成果都給予了很高的評價。
全國政協副主席、原國家民委主任王正偉在西南民族大學視察時強調:西南民族大學許多專業走在了民族院校的前列,尤其是在藏彝族語言文字信息處理方面,出現了很多開拓性的和領先性的成果,為少數民族信息化建設做了貢獻。
中央電視台、中國民族報、華西都市報、四川新聞網、人民網、新華網、國家民委網站、教育部網站等多家媒體和權威網站都用專題對中心完成的科研成果進行了報導,給予了很高的評價,為民族語言與傳統文化的傳承與創新發展提供了新的理論與實踐探索,也將進一步提升民族文化對當今社會的解釋力和影響力。
六、中心發展規劃
在保持這些傳統特色的基礎上,在民族語言信息處理系統的開發、民族語言語料庫的研究與建設、民族古籍文獻數位化開發、民族語言的自然理解研究以及民族語言資源資料庫的建設等方面進一步開拓研究領域,實現民族語言文字信息處理技術在深度挖掘、智慧型、數位化方面的突破,實現研究方向從對“民族語言文字元形式的計算機處理”到對“民族語言文字語義層面上的信息知識的智慧型挖掘和處理”的轉變,開展民族語言語音資源庫的建設,實現“視覺處理”和“聽覺處理”的兩條研究方向的齊頭並進,為實現“字元處理”到“語義處理”打下堅實的基礎。
同時藉助新的信息處理技術擴展民族語言文字信息處理技術的套用範圍,逐步開展通訊終端的APP運用技術開發,拓寬中心的基礎研究能力,使之成為能解決民族語言的實際套用、信息化建設進程中的基礎性問題的研發與人才培養基地,成為發展少數民族地區科學、技術、文化,促進社會進步的新型科研中心。