平衡語料庫(balanced corpus)是2011年公布的語言學名詞。
基本介紹
- 中文名:平衡語料庫
- 外文名:balanced corpus
- 所屬學科:語言學
- 公布時間:2011年
平衡語料庫(balanced corpus)是2011年公布的語言學名詞。
平衡語料庫(balanced corpus)是2011年公布的語言學名詞。定義在語料採集時按照平衡性原則進行隨機抽樣,使語料的類別分布比例和時間分布比例相對均勻,能夠充分反映和記錄語言的實際使用情況的語料庫。書面語語料類...
布朗語料庫(Brown Corpus)在一九六0年代 中期構建的一個具代表性的平衡語料庫包含各種不同的文體,根據抽樣調查決定了一個他們認為英文平衡語料庫應有的分布,再根據此一分布收集了百萬詞的語料,並加上詞類標記,輸入電腦。建構成了第...
⑵同質的(Homogeneous):只收集同一類內容的語料;⑶系統的(Systematic):根據預先確定的原則和比例收集語料,使語料具有平衡性和系統性,能夠代表某一範圍內的語言事實;⑷專用的(Specialized):只收集用於某一特定用途的語料。
⑦信息處理用漢語文本分詞規範和詞性標準的制訂;⑧關於語料庫語文學的理論思考。並構造了相應的原型或實驗系統,取得了有特色的成果。建立了1億2千萬字質量可靠的漢語生語料庫及200萬字經過分詞和詞性標準的漢語平衡語料庫。
2.1.1 語料庫建設的基本過程 / 10 2.1.2 語料庫建設面臨的問題 / 10 2.2 語料庫建設的原則和規範 / 11 2.2.1 語料庫總的建設原則 / 11 2.2.2 語料庫的不規範性 / 12 2.3 語料庫建設的平衡性與代表性 / 13...
第一節 語料庫的發展及主要類型 一 初始階段的語料庫 二 復興階段的語料庫(第一代語料庫)三 第二代大型語料庫 四 語料庫的類型 第二節 語料庫設計中的問題 一 語料庫的規模 二 語料庫的內容 三 語料庫的代表性與平衡 第三...
7.2 語料庫口譯研究的複合設計 ·163 7.2.1 定量與定性相平衡的原則 ·163 7.2.2 描述與解釋相配合的原則 ·163 7.2.3 微觀與巨觀相結合的原則 ·163 7.2.4 共時與歷時相協調的原則 ·164 7.2.5 證實與證偽相促進的...
1.多語種單雙語語料庫 2.多語種學習者語料庫 3.多學科學術英語語料庫 4.漢語口筆語平衡語料庫 外語健腦強智研究中心 本中心綜合腦神經科學、雙語與多語習得研究、人生智力發展研究、腦疾病與康復、衰老與語言蝕失、老年痴呆與語言障礙...
美國當代英語語料庫(The Corpus of Contemporary American English或COCA)是迄今規模最大的平衡語料庫,由美國Brigham Young University開發,現有庫容4.5億詞,涵蓋美國1990-2012年口語、小說、流行雜誌、報紙和學術期刊五大類型的語料,...
國語水平測試實施綱就是測查應試人國語規範程度、熟練程度,認定其國語水平等級的國家級口語考試,是國家推廣國語的重要措施之一,自1994年起在各地各行迅速展開。歷史沿革 《實施綱要》充分利用國家語委現代漢語大規模平衡語料庫、廈門...
《漢語迂迴致使結構的多維度研究》是一本2022年中國社會科學出版社出版的圖書,作者是楊江鋒。內容簡介 本研究在認知構式語法視域下,採用現代漢語書面語平衡語料庫和多語體口語語料庫作為數據來源,探討了學界關注較少的漢語迂迴致使結構的...
語料庫 套用計算機技術存儲語言材料的總匯。語料範圍可以是綜合的,也可以是專項的,如國家語委“現代漢語平衡語料庫”(收1919-2002年的語料9100萬漢字)。語料庫的容量大小和編制體例可根據需要設計,內容也可以及時更新補充。19.《...
本書首先對日本五大擬聲擬態詞詞典和包含1億多個詞的大型平衡語料庫展開調查,抽取了1466個常用日語擬聲擬態詞。再運用了六大語料庫和六大統計學手法對日語擬聲擬態詞的五大語言特徵進行了精密且全面的解析。使用中日平行語料庫比較了中日...
(4)語料庫與社會語言學研究方法,《浙江大學學報·人文社會科學版》,2012年第4期(人大書報資料中心複印報刊資料全文轉載)(5)基於詞典的語料庫詞義標註研究,《語言文字套用》,2010年第2期 (6)現代漢語通用平衡語料庫建設與套用...
採用了9個信息龐大的“語料庫”的數據進行了統計,其中,最重要的兩個語料庫是“國家語委現代漢語平衡語料庫”和“北京語言大學現代新聞媒體動態流通語料庫”,收錄的漢字量分別為9100萬和3.5億。字表性質 規範性是字表的首要特點,也是...
黃教授曾主持或共同主持開發以下各種中文語言資源:中文詞知識庫(CKIP)辭彙庫與語法訊息、研究院語料庫(第一個有詞類標計的中文平衡語料庫;1997年上網)、中央研究院中英雙語知識本體詞網(Sinica BOW)、中文辭彙素描系統(Chinese Word...
第六章 語料庫檢索 267 第一節 單語語料庫 268 一、COCA 268 二、Linggle 279 三、WebCorp 284 四、Sketch Engine 290 五、北京語言大學語料庫中心 298 六、現代漢語平衡語料庫 306 第二節 雙語語料庫 310 一、北大法律英文網 ...
《當代漢語學習詞典》是一本商務印書館出版的圖書。內容簡介 以學習型詞典理論作為理念指引,用最核心的4000多個詞語作為釋義語言,以海量平衡當代語料庫作為釋義、例證的基礎。收錄現代漢語辭彙中最常見常用的6400多個詞語。是一部站在時代...
現代漢語中介語平衡語料庫建庫方法淺議 第二語言習得者寫作中介詞“與”的偏誤分析研究 高級漢語水平學習者句末語氣詞使用規律分析 韓國學生漢韓漢字詞動賓型動詞使用偏誤分析 表情符號在跨文化交流中的功能與再符號化 論對外歷史文化課...
為語言文字工作者提供理論和技術支持;搭建漢語信息處理的資源平台,探索資源建設與漢語信息處理技術套用的結合點;推動語言文字知識庫、各種語料庫、“中華大字元集”等資源庫的建設,對國家語委現代漢語平衡語料庫進行深度開發利用並提供給...
一國家語委現代漢語通用平衡語料庫簡介 二延指等價句中同位基的可及性分析 第五節本章小結 第六章隱喻指稱(Metaphoricreference)與轉喻指稱(Metonymicreference)第一節隱喻指稱和轉喻指稱的差異 一隱喻指稱 二轉喻指稱 三兩者區別 四...
例句源於10多億字的北大中文系平衡語料庫和人民日報報系,規範、鮮活,便於學習使用。編寫了130多組近義和易混易錯成語的辦析,設有[注意]欄目,提示古代語言文字知識、成語的語義結構; [小知識] 欄目,講述與成語相關的古代文化知識、...
8.基於分語體平衡語料庫的語體辭彙研究(WY20062402) 校基金 3萬 2006-2008 9.我國辭書研究隊伍網路資源庫與信息挖掘系統的開發與套用 YB115-39 國家語委 5萬 2010-2013 10. 專業碩士與學術碩士學位論文寫作對比研究(sdyy11147)...
3.主持2010年貴州省教育廳高校人文社會科學研究課題“貴州省旅遊資源英漢平衡語料庫(11ZC040)”,2011年7月立項,研究進行中。出版圖書 論文 1、中國英語體系現有的語音特徵和語篇特徵.和田師院學報,2011年2月刊;2、中國英語存在的...
·語料庫建設與加工 ·國家語言文字套用"十五"科研項目“現代漢語語料庫建設及深加工”;·國家高技術研究發展計畫(863計畫)“智慧型中文信息處理平台”課題 ·超大規模通用平衡語料庫 (15億字)·國家語委國語測試語音資料庫 ·語言資源...
《現代漢語因果複句優先序列研究》首先選擇各種類型的語體,對一定數量的語料(100萬字)進行了窮盡性的分析,建立了一個現代漢語複句的平衡樣本語料庫。在語料庫的基礎上,分析了現代漢語複句的優先序列,找出了因果複句在複句序列中的位置...
基於藏語信息處理的詞類體系研究 藏文線上輸入法的設計與實現 大型藏語平衡語料庫建設中樣本類別號的研究 基於小字元集的藏文自動分詞技術研究 高校人力成本核算模型與算例分析 附錄 《西藏大學學報》(自然科學版)刊載總(1993—2014)