《基於大規模語料庫的漢語詞語自動聚類研究》是依託哈爾濱工業大學,由王曉龍擔任項目負責人的面上項目。
基本介紹
- 中文名:基於大規模語料庫的漢語詞語自動聚類研究
- 依託單位:哈爾濱工業大學
- 項目類別:面上項目
- 項目負責人:王曉龍
- 研究期限:2000-01-01 至 2002-12-31
- 申請代碼:F0211
- 批准號:F0211
- 負責人職稱:教授
- 支持經費:12(萬元)
《基於大規模語料庫的漢語詞語自動聚類研究》是依託哈爾濱工業大學,由王曉龍擔任項目負責人的面上項目。
《基於大規模語料庫的漢語詞語自動聚類研究》是依託哈爾濱工業大學,由王曉龍擔任項目負責人的面上項目。項目摘要本項目以基於大規模語料庫的漢語字、詞的不同元數尤其是三元以上的同現機率統計為基礎,研究有關漢語詞語自動聚類關鍵技術...
3. 中文大規模基礎語料庫構建:課題組創建並發布了一個由200多萬中文短文本組成的大型自動文摘生成語料庫,發布了側重於意圖匹配的大規模漢語問題匹配語料庫LCQMC,基礎語料庫已被清華、CMU等100多家著名高校、機構使用,為推動中文的國際化做出了重要貢獻。 4. 基於深度學習的醫療文本實體與關係挖掘研究:開展了基於深...
《語料庫語言學-工具與案例》是2020年外語教學與研究出版社出版的圖書。作者是劉華。本書基於真實問卷調查數據分析,符合漢語研究的各項需求,特別是貼合了漢語研究者文科生的動手特點,軟體架構、界面設計和編碼清晰簡潔,將複雜的統計、計算過程隱藏於後台,前端一鍵式、步驟式操作,簡單易用。內容簡介 "漢語助研"是...
《基於大規模語料庫的漢語詞語自動聚類研究》是依託哈爾濱工業大學,由王曉龍擔任項目負責人的面上項目。項目摘要 本項目以基於大規模語料庫的漢語字、詞的不同元數尤其是三元以上的同現機率統計為基礎,研究有關漢語詞語自動聚類關鍵技術,包括漢語構詞統計規律、基於上下文的詞語相似度的計算方法、面向大詞表的詞語自動...
關鍵字標引功能自動聚集某話題語料,同時,生成該話題的話題詞表,並進行話題對應常用句、詞語搭配、影視資源的研究。4. 計算語言學輔助漢語(華語)及漢語教學研究 基於大規模語料庫、利用計算語言學方法輔助海外華語字詞調查研究,發表多篇論文和研究報告(《中國語言生活狀況報告》,國家語委發布,商務印書館出版)。
◆ 唐旭日。雙音節形容詞的性質化傾向,第十屆漢語語法化問題國際學術討論會,宜昌,2019年。◆ 孟福永,唐旭日。基於大數據的認知語義計算—評《詞語認知屬性的知識庫構建和套用》,《外語教育》,2019。◆ TANG,X. (2018). A state-of-the-art of semantic change computation. NaturalLanguage Engineering, 24(...
構建大規模的漢語語塊庫 統計和詞典方法相結合的雙語語料庫詞對齊 基於三元統計模型的漢語分詞及標註一體化研究 基於反比機率模型和規則的中文姓名自動辨識系統 大規模真實文本中漢語動詞語法搭配模板的自動識別 漢語動賓搭配的自動識別研究 基於單字詞轉移機率的未登錄詞識別 漢語名詞和形容詞的聚類算法研究 面向依存文法...
【2003】 俞士汶、段慧明、朱學鋒、孫斌、常寶寶,北大語料庫加工規範:切分·詞性標註·注音,《漢語語言與計算學報》,2003年6月,第13卷2期,P121-158 【2003】 俞士汶,現代漢語短語結構知識庫規格說明書,《漢語語言與計算學報》,2003年6月,第13卷2期,P215-226 【2003】 俞士汶,北京大學語言知識庫概況...
本文介紹了NLU和NLP、NLG的關係,並基於數據流將NLU的內容進行整理,最後對文本分類、文本聚類和NER這3種典型任務的目標和思路進行了簡單說明。簡介 Natural Language Understanding 俗稱人機對話。人工智慧的分支學科。研究用電子計算機模擬人的語言交際過程,使計算機能理解和運用人類社會的自然語言如漢語、英語等,實現...