TF-IDF(term frequency–inverse document frequency)詞頻--反轉檔案頻率,是一種用於情報檢索與文本挖掘的常用加權技術,用以評估一個詞對於一個檔案或者一個語料庫中的一個領域檔案集的重複程度。詞頻統計為學術研究提供了新的方法和視野。
基本介紹
- 中文名:詞頻
- 拼音:cí pín
- 釋義:語言材料中詞的使用頻率
- 詞性:名詞
TF-IDF(term frequency–inverse document frequency)詞頻--反轉檔案頻率,是一種用於情報檢索與文本挖掘的常用加權技術,用以評估一個詞對於一個檔案或者一個語料庫中的一個領域檔案集的重複程度。詞頻統計為學術研究提供了新的方法和視野。
TF-IDF(term frequency–inverse document frequency)詞頻--反轉檔案頻率,是一種用於情報檢索與文本挖掘的常用加權技術,用以評估一個詞對於一個檔案或者一個語料庫中...
詞頻效應(word frequency effect)是指指人們對高頻詞的識別快於對低頻詞的識別。這一現象普遍存在於各種文字系統中,得到了大量實驗的證實。關於其產生機制,主要存在...
關鍵字詞頻是指某個關鍵字在頁面中出現的頻率,也即關鍵字在頁面出現的次數,從一定程度上反映了頁面與該關鍵字之間的相關性。...
詞頻分布定律law of distribution for word frequencies關於單詞在文獻中出現頻次的分布規律。亦稱省力法則。...
《詞頻背單詞》是一款手機套用,於2012年02月24日版本更新,支持OS與 iPhone、iPod touch、iPad 兼容。...
《辭彙詞頻手冊》是2004年中國建材工業出版社出版的圖書,作者是李躍平,楊廷君。...... 《辭彙詞頻手冊》是2004年中國建材工業出版社出版的圖書,作者是李躍平,楊廷君。...
詞頻背高考是一個學習英語的應用程式網站,支持OS:與 iPhone、iPod touch、iPad 兼容。...
詞頻背六級,包含CET-6考試大綱要求單詞的完整列表, 單詞排序依照它們在生活場景中的出現頻率來由高至低排序。詞頻統計來自於擁有41億辭彙量的美國國家語料庫單詞使用...
Google2010年12月19日推出了與哈佛大學合作的科學實驗項目“圖書詞頻統計器”,可對1800年到2000年世界上4%的圖書,總計5億個辭彙進行詞頻統計,查看語言和文化的...
《2007-考研英語辭彙真題詞頻記憶法》是2006年中國國際廣播音像出版社出版的圖書,作者是郭崇興。...
“圖書詞頻統計器”考察自1800年到21世紀的辭彙變化。...... 谷歌本周推出了與哈佛大學合作的科學實驗項目“圖書詞頻統計器”,可對1800年到2000年世界上4%的圖書,...
《隨時隨地記單詞CET-6辭彙、詞頻最佳化記憶、軟體MP3》內容簡介:經過對歷年真題的分析,《隨時隨地記單詞CET-6辭彙、詞頻最佳化記憶、軟體MP3》按照真題的詞頻順序,將...
《2010考研英語辭彙寶典:詞頻·真題·例句》特地列出了過於簡單的單詞除外的其他大綱辭彙,使《2010考研英語辭彙寶典:詞頻·真題·例句》具有一種“詞典”功能。讀者...
《新TOEFL辭彙·詞頻最佳化記憶》是機械工業出版社2012年 出版的圖書,作者是甘棠。...... 《新TOEFL辭彙·詞頻最佳化記憶》是機械工業出版社2012年 出版的圖書,作者是甘...
《隨時隨地記單詞IELTS辭彙·詞頻最佳化記憶·軟體》經過對歷年真題的分析,《隨時隨地記單詞IELTS辭彙·詞頻最佳化記憶·軟體》按照真題的詞頻順序,將0ELTS辭彙分為基礎...
詞頻背托福,是一款免費的教育軟體。2012年2月28日更新。支持系統與 iPhone、iPod touch、iPad 兼容。...
《猴哥新托福詞頻9000》是啄木鳥教育-滿分培訓TOEFL系列叢書之一,本書中的單詞從89年至今的近100次托福考試、400篇閱讀中統計而來,涉及的辭彙總量高達40萬,並按其...
《辭彙詞頻手冊/成人高等教育英語考試》是2004年中國建材工業出版社出版的圖書,作者是李躍平。...
《隨時隨地記單詞IELTS辭彙詞頻最佳化記憶手機記憶手冊mp3》是2012年機械工業出版社出版的書籍,作者是甘棠。...
TF-IDF(term frequency–inverse document frequency)是一種用於信息檢索與數據挖掘的常用加權技術。TF意思是詞頻(Term Frequency),IDF意思是逆文本頻率指數(Inverse ...
TFIDF實際上是:TF * IDF,TF詞頻(Term Frequency),IDF反文檔頻率(Inverse Document Frequency)。TF表示詞條在文檔d中出現的頻率。IDF的主要思想是:如果包含詞條t的...
齊普夫定律是美國學者G.K.齊普夫於20世紀40年代提出的詞頻分布定律。它可以表述為:如果把一篇較長文章中每個詞出現的頻次統計起來,按照高頻詞在前、低頻詞在後的...
Hightman開發的一套基於詞頻詞典的機械中文分詞引擎,它能將一整段的漢字基本正確的切分成詞。採用的是採集的詞頻詞典,並輔以一定的專有名稱,人名,地名,數字年代等...