新聞漢語詞庫

新聞漢語詞庫是供新聞報導文字檢索,將漢語文字輸入電腦的新聞資料系統。由新華社、人民日報社和廣播電影電視部等單位共同研製,於1990年11月28日正式通過機械電子工業部計算機司組織的技術鑑定。“新聞漢語詞庫”於1987年11月份正式列入國家“七五”計畫的重點科技攻關課題。經過多方關懷及通力合作,歷經三年,終於研製完成,是迄今國內規模最大的專業詞庫,也是國內外第一個新聞專業漢語詞庫。

該詞庫在廣泛收集語言資料的基礎上,精選出近30萬個詞條,經人工和計算機處理,再經一億二千萬新聞語言資料的詞頻統計,最后綜合而成。該詞庫選詞依據充分、可靠,具有全面、精確、通用性強等特點,不僅適用新聞界,而且對整箇中文信息處理都有重要的實用意義。原國家有關部門曾於1986年決定,在新華社建立全國新聞資料檢索中心,同時,人民日報社、廣播電影電視部及其他新聞單位可根據本身的特殊需要,建立具有各自特點的分系統。為了實現在核心繫統的覆蓋、支持下,作到各單位建立的分系統的信息也能相互共存,力求聯合研製一個適用於新聞界的“新聞漢語詞庫”,並由新華社、人民日報社、廣播電影電視部及北京信息工程學院投入研製,並得到了中國人民大學、北京航空航天大學、山東大學、山西大學等協作單位的通力配合。“新聞漢語詞庫”共收各類詞條70097條,主要有普通詞、專有名詞和新聞、廣播、電視專門術語及常用新聞結構串三部分組成。普通詞5.5萬,占詞庫總詞量的97%,專有名詞和新聞用詞分別占總詞量的18.7%和2.3%。這就保證了“新聞漢語詞庫”與其他漢語詞庫的兼容性,同時也保證了詞庫本身所具有的特殊性。

相關詞條

熱門詞條

聯絡我們