標註語料庫(tagged corpus)是2011年公布的語言學名詞。
基本介紹
- 中文名:標註語料庫
- 外文名:tagged corpus
- 所屬學科:語言學
- 公布時間:2011年
標註語料庫(tagged corpus)是2011年公布的語言學名詞。
《現代漢語深度語義標註研究》圍繞現代漢語深度語義標註語料庫的建設和套用,進行了基於語義詞類自動標註和句法語義範疇中的語義角色標註研究,從實踐上驗證了語義語法學在自然語言處理中的可行性和實用性。圖書目錄 緒論 一、學術背景與選題...
《語料庫語言學-工具與案例》是2020年外語教學與研究出版社出版的圖書。作者是劉華。本書基於真實問卷調查數據分析,符合漢語研究的各項需求,特別是貼合了漢語研究者文科生的動手特點,軟體架構、界面設計和編碼清晰簡潔,將複雜的統計、...
3.1 漢語語料庫加工規範 3.2 漢語人名標註及其方法 第4章 基於語料庫的漢語字詞統計與分析 4.l HowNet的詞語統計 4.2 結構化詞表的統計與分析 4.3 網路漢字的大規模統計與分析 4.4 800萬標註語料統計 4.5 500萬標註...
1.5 學習者語料庫的研究方法 第二章 SWECCL 1.0的設計與建立 2.1 SWECCL 1.0的建庫程式 2.2 語料的來源 2.3 樣本的選擇 2.4 轉錄與轉寫 2.5 規模與結構 2.6 文本頭部信息 2.7 口語特徵標註 2.8 部分語法錯誤...
第3章 詞性標註研究概述 16 3.1 詞性標註與語料庫加工 16 3.2 主要的英語語料庫介紹 19 3.3 主要的漢語語料庫介紹 20 3.4 有關漢語詞性標註的評測活動 22 3.5 語言工程中的自動標註方法研究 23 第4章 詞類屬性調查 28 4....
從發展、現狀與對策,兩個漢語中介語語料庫的案例分析,標註規範,建設標準,軟體系統等方面對漢語中介語語料庫建設進行了全面的研究和探討,並從學科巨觀角度對漢語中介語語料庫建設進行了理性思考與總結,包括語料庫建設的根本目的與宗旨、...
第一節 生語料庫建設 一 語料的收集 二 語料的錄入 第二節 標註語料庫建設 一 標註原則的確立 二 標註項目及標記集的確立 三 標註規範的確立 第三節 開發檢索系統 第四章 語料庫建設中遇到的問題與解決方案 一 自動分詞和詞性...
帶詞性標註的檔案下落不明,帶漢語拼音標註的檔案顯示為亂碼,已無法使用。語料庫在電腦系統里已無法使用。北京語言大學語言研究所自2001年建立以來,把重建完整、科學、實用的“北京口語語料”作為一項重要工作。2004年,“當代北京話套用...
《語料庫支撐的系統功能語法研究》是浙江大學出版社出版的圖書,作者是劉建鵬 內容簡介 語料庫支撐的系統功能語法研究是一個新的語言學研究視角,它的核心是在系統功能語法理論框架下實現語料庫中生語料的半自動化和自動化句法檢索、標註和...
2.2 世界英語語法的語料庫研究 2.3 語料標註與分析 第三章 案例一 世界英語中的過去完成式 3.1 引言 3.2 研究背景 3.3 研究設計 3.4 頻率分析 3.5 功能分析 3.6 結論 第四章 案例二 菲律賓英語語法的口語化 4.1 引言...
可以手把手地指導你一種經驗證的標註開發周期一一把元語添加到你的訓練語料庫中來幫助機器學習算法更有效工作的過程。你無需任何編程或者語言學方面的經驗就可以上手。《自然語言標註:用於機器學習(影印版)》通過每一步中的詳細示例,你...
《基於語料庫的中國學習者英語口語中語用標記語研究》是2015年上海交通大學出版社出版的圖書,作者是王麗。內容簡介 基於前人的理論與實證研究,《基於語料庫的中國學習者英語口語中語用標記語研究(英文版)》提出了語用標記語的理論框架...
作者在借鑑前人研究成果的基礎上,以新加坡國小華文教材為藍本,建構了以服務漢語教學為目標導向的新加坡國小華文教材語料庫,在漢語教學界尚屬首創。該語料庫在語料標註、功能項目設計等方面都有所創新,能實現語音、漢字、辭彙等多項語言...
二十世紀80-90年代,學界開始嘗試使用隱馬爾可夫模型(Hidden Markov Model, HMM)進行詞性標註並取得了成功,以HMM為代表的詞性標註方法也由此被廣泛套用於各類大規模語料庫的NLP和文本挖掘。理論 詞性標註在本質上是分類問題,將語料庫中...
分詞、標註詞性、句法成分、語義角色、辭彙語義類的語料庫因此建立,這一語料庫在大規模標註語料庫基礎上統計分析了語義角色句法實現所受的辭彙語義制約,即語義角色、句法成分、辭彙語義類之間的對應(映射、投射)關係,說明了哪個辭彙語義...
LIVAC漢語共時語料庫 北京大學語料庫 蘭開斯特大學漢語平衡語料庫 蘭開斯特-洛杉磯漢語口語語料庫 語料庫語言學線上 北京森林工作室漢語句義結構標註語料庫 參見 萬能翻譯機 電腦語言學 受限自然語言 信息抽取 資訊檢索 自然語言理解 潛在語義...
《漢英句法對比:基於依存樹庫的語言計量研究》是一本2022年社會科學文獻出版社出版的圖書,作者是李雯雯。內容簡介 該書稿以依存語法為理論基礎,以對比研究和計量研究為研究基礎和研究方法,以句法標註語料庫為研究工具,以句法為研究對象...
第5章 分類和標註辭彙 195 5.1 使用詞性標註器 195 5.2 標註語料庫 197 5.3 使用python字典映射詞及其屬性 206 5.4 自動標註 216 5.5 n-gram標註 221 5.6 基於轉換的標註 228 5.7 如何確定一個詞的分類 230 5.8 小結 233 ...
2、語義依存關係標註語料庫 該語料庫人工標註語義依存關係,目前規模三萬句,是語言文字信息技術與套用的深層次語義資源。2015年,基於該語料庫,成功組織了國際評測Semeval 2015中文語義關係評測任務。3、科技文獻語料庫 目前涵蓋計算機、...
核心框架語義依存圖及完全框架語義依存圖的表示及規範;(2)構建了面向框架語義依存圖抽取中各項任務的標註語料,包括CFN三庫補充,針對框架排歧、目標詞識別、框架元素核心詞提取、框架元素標註以及零形式識別任務的語料庫;(3)實現了...
評價辭彙知識庫以框架為詞語分類依據,共構建了73個框架,涉及520個評價詞,描述了詞語的情感值信息;評價詞典對領域內語料的覆蓋面達到93.9%。採用基於詞典和模式匹配規則的方法,標註了大規模顧客評論文本,構建了中文評價語義標註語料庫...
6.南京師範大學教改重中之重項目:語言科技新型課程優質教學資源庫研究(主持);7.山東省語言資源開發與套用重點實驗室開放課題:基於標註語料庫的語義角色排序機(主持);8.國家自然科學基金項目:漢語焦點信息影響代詞回指的行為和腦電...
1.基於HNC的現代漢語句子級語義標註語料庫的研究和建立, 中國社會科學出版社,2015.2 2.A Hybrid Strategy Method for Patent Machine Translation, IALP 2016, IEEE Press,pp236-239 3.服務於漢英機器翻譯的HNC詞語知識庫建設, 語言...
2.4 詞性標註 38 2.4.1 基於規則的詞性標註 39 2.4.2 基於隱馬爾可夫模型的詞性標註 40 2.4.3 基於卷積神經網路的詞性標註 42 2.4.4 詞性標註評測方法 44 2.4.5 詞性標註語料庫 45 2.5 延伸閱讀 46 2.6 習題 47...
29、“漢語資料庫建設及其套用”課程建設 30、通用計算機智慧型考試系統及題庫建設,《面向21世紀中文專業教學內容和課程體系改革探索》,中國文聯出版社,2000年12月。31、全信息標註語料庫的開發與套用 32、基於資料庫的現代漢語詞類優勢...
主持完成了國家973子項目“中文語料庫建設”中的分詞標註語料庫建設,山西省青年自然科學基金項目“漢語辭彙語義知識的獲取與組織研究”;參與了國家863項目“漢語語料庫與深加工軟體評測技術”、“中文文本語料庫深加工質量檢驗技術研究”,...
屬於該項目研究成果的資源有領域語料庫(包括全唐詩約5萬首、全宋詞約2萬首、全元曲約0.5萬首、對聯約0.7萬條)、領域標註語料庫(完成分詞、詞義標註、句樹標註的唐詩504首)、知識庫(漢字字型檔、詞庫、詞聯接庫、音韻知識庫、...
基於Web的詞典編纂語料自動採集技術研究 漢英詞典編纂自動化平台Cpsl)ict系統介紹 去蕪取菁:利用網際網路及語料庫篩選新詞 商務印書館辭書語料暨辭書編纂系統(CPCL)簡介 談針對辭書編纂的原始文獻庫建設 面向辭書編纂的術語和定義標註語料庫...
5.4.3標註語料庫97 第6章引用100 6.1數據結構與編程100 6.2什麼是引用101 6.2.1引用的概念101 6.2.2取得引用101 6.2.3通過引用訪問數據103 6.3使用引用構造複雜數據結構105 6.3.1值為數組的數組105 6.3.2值為哈希的...