詞頻統計(word count)是2011年公布的語言學名詞。
基本介紹
- 中文名:詞頻統計
- 外文名:word count
- 所屬學科:語言學
- 公布時間:2011年
詞頻統計(word count)是2011年公布的語言學名詞。
詞頻統計(word count)是2011年公布的語言學名詞。定義對語篇或語料庫中某一語詞或短語出現的頻數進行統計的過程或結果。出處《語言學名詞》第一版。1...
詞頻,是一種用於情報檢索與文本挖掘的常用加權技術,用以評估一個詞對於一個檔案或者一個語料庫中的一個領域檔案集的重複程度。詞頻統計為學術研究提供了新的方法和視野。詞義 【詞語】:詞頻 詞頻統計 字詞的重要性隨著它在檔案中出現...
《書籍詞頻統計器》是一種用於書籍詞頻統計的軟體設備。簡介 Google2010年12月19日推出了與哈佛大學合作的科學實驗項目“圖書詞頻統計器”,可對1800年到2000年世界上4%的圖書,總計5億個辭彙進行詞頻統計,查看語言和文化的發展趨勢,...
齊普夫定律是美國學者G.K.齊普夫於20世紀40年代提出的詞頻分布定律。它可以表述為:如果把一篇較長文章中每個詞出現的頻次統計起來,按照高頻詞在前、低頻詞在後的遞減順序排列,並用自然數給這些詞編上等級序號,即頻次最高的詞等級為1...
關鍵字詞頻是指某個關鍵字在頁面中出現的頻率。也即關鍵字在頁面出現的次數,從一定程度上反映了頁面與該關鍵字之間的相關性。概念:在搜尋引擎發展初期,搜尋結果中頁面的排序基本是由關鍵字詞頻所決定的。也就是說,頁面中某個關鍵字...
6.原詞頻表的1811個辭彙構成了本書的核心辭彙,加上以這些辭彙為基礎添力。的同根詞、同義詞,本書實錄辭彙5000多個,更力,全面地覆蓋了TOEFL。考試所需掌握的辭彙。作品目錄 第一篇 會計概述第一章 誘人的會計職業會計職業充滿...
優選的,所述的輸入法詞頻庫的生成方法,還包括:對所述獲取的網頁分別賦予相應的權重值,所述權重值用以表示該網頁在所有被分析網頁詞頻統計中的重要性;對該網頁的詞條進行詞頻統計後,根據所述權重值進行修正,得到該網頁的詞頻統計...
詞頻標記 詞頻標記(word token)是2011年公布的語言學名詞。定義 語詞在特定文本或語料庫中出現的實例,即一個語言形式出現一次就為一個標記數。語料庫的詞頻統計常用標記數表示。出處 《語言學名詞》第一版。
詞頻索引 詞頻索引(word frequency index)是2011年公布的語言學名詞。定義 按照頻率排列的單詞索引。也指信息檢索中,在詞頻統計的基礎上,藉助非用詞詞表和用詞詞表,按照字母排序生成的用詞索引。出處 《語言學名詞》第一版。
現代漢語常用詞詞頻詞典 《現代漢語常用詞詞頻詞典》是宇航出版社出版的圖書,作者是劉源
本辭彙書針對市場上辭彙書籍的一些實用性大小的問題,對近十年各省市高考試題抽取85套進行詞頻統計,給出的派生詞都是在高考題中出現過的;給出的注釋和搭配體現高頻考點;得出不給漢語注釋的超綱詞約300個;用表格的形式,英文在左,...
《辭彙詞頻手冊》是2004年中國建材工業出版社出版的圖書,作者是李躍平,楊廷君。內容介紹 本書將《全國各類成人高等學校招生複習考試大綱》(英語)以及相應的《教學大綱》的辭彙根據辭彙的使用頻率,參照新版《柯林斯COBUILD英語辭典》的詞頻...
基礎研究:漢字字頻統計、詞頻統計、漢語自動分詞、句法屬性研究、漢字編碼字元集 、通用漢字樣本庫、漢字屬性字典、語料庫等 輸入技術:中文輸入法、中文手寫輸入、中文語音輸入、文字識別等 輸出技術:漢字字模技術(字型庫)、漢字雷射照...
詞頻統計其實根本沒有利用任何跟網路有關的特性,是前網路時代的技術。然而,網路時代的主要文獻是以網頁的形式存在的,而幾乎每個人都可以隨心所欲地在網上發表各種內容,詞頻相同的兩個網頁,質量相差可以很遠,可是按照搜尋引擎的第一...
軟體內含主要考試詞庫(高考、四六級、考研、專四、專八以及日常用語等),均為考試大綱詞庫或國外知名新聞網站經過詞頻統計最佳化而成。軟體支持艾賓浩斯記憶曲線等科學記憶方法,支持開屏速記等特色功能,支持熟悉單詞批量篩選等實用功能,支持...
2. 標註單詞級別:標註單詞的高考詞頻、閱讀星級、口語和書面語級別。高考詞頻從低到高以1到5級表示。閱讀詞頻,由低到高以1到3表示。口語和書面語以1到3表示常用性在1000詞以內到3000詞以內。3. 精講重難點辭彙:收錄近5000個教材...
文獻計量指的是情報傳遞過程中的計量科學。不僅是包括我們所熟悉的各類具體的文獻,而且還包括一切與文獻相關的各類指標。作者數量,詞頻統計,引文數量,流通數量,複製數量等。是定量與定性結合的分析方法。其中涉及三個典型模型:布拉德福...
7.大學英語四級真題辭彙分頻速記手冊【詞頻統計+例句+巧記速記】8.大學英語四級辭彙周計畫【每周辭彙精選+每周單元測試+巧記速記】9.大學英語四級聽力高分特訓500題【命題分析+答題攻略+強化訓練】10.大學英語四級閱讀理解高分特訓100...
37小時熟記雅思3552核心辭彙是基於“循環記憶法”理論,專門為參加雅思(IELTS)考試的考生編寫的。本書編者經過電腦詞頻統計,精選出常考辭彙中的3552個核心辭彙,分成37個小時,供讀者記誦。單詞的排列順序完全是按照循環記憶法的核心規律編排...
本規範中指用於詞頻統計的國語書面語中的語言資料。⒊5 詞頻(word frequency)在一定數量的語料中同一個詞語出現的頻度,一般用詞語的出現次數或覆蓋率來表示。本規範中指詞語的出現次數。4 整理異形詞的主要原則 現代漢語中異形詞的...
1.4詞頻知識 1.4.1高頻詞 1.4.2學術辭彙 1.4.3低頻詞 1.4.4關於詞頻統計 1.4.5“詞頻概貌”與辭彙知識 第2章二語習得中的辭彙知識習得研究 2.1關於辭彙知識 2.1.1辭彙知識是一個連續體 2.1.2接受性和輸出性辭彙知識...
中國流行語的選擇方法是通過TRS智慧型信息處理軟體,以北京、上海、廣東、四川等地具有代表性的報紙為語料樣本,並參照一些新聞網站,依照詞頻統計分析選出。歷年流行語 2004年 2004年的十大流行語是按照年度發布的。最具影響力流行語 科學...
這種分詞方法,在由北京航空學院等十多個單位協同進行的我國第一次大規模現代漢語詞頻統計工作中,實現了我國第一個自動分詞系統CDWS。逆向最大匹配法 亦稱OMM法,或RMM,IMM法;其基本原理和MM法相同,不同的是分詞切分方向;它從被...
《考研英語真題辭彙21天突破》是史上第一本完全按照真題詞頻排序的考研辭彙書。最新權威詞頻統計,最具效率的單詞排列。圖書目錄 詞頻辭彙 高頻辭彙 DAY 01 DAY 02 DAY 03 DAY 04 DAY 05 中頻辭彙 DAY 06 DAY 07 DAY 08 DAY 09 ...