詞頻索引(word frequency index)是2011年公布的語言學名詞。
基本介紹
- 中文名:詞頻索引
- 外文名:word frequency index
- 所屬學科:語言學
- 公布時間:2011年
詞頻索引(word frequency index)是2011年公布的語言學名詞。
詞頻索引(word frequency index)是2011年公布的語言學名詞。定義按照頻率排列的單詞索引。也指信息檢索中,在詞頻統計的基礎上,藉助非用詞詞表和用詞詞表,按照字母排序生成的用詞索引。出處《語言學名詞》第...
(2)詞頻及密度。通常情況下,搜尋詞的密度和其在頁面中出現的次數成正相關,次數越多,說明密度越大,頁面與搜尋詞關係越密切。(3)關鍵字位置及形式。關鍵字出現在比較重要的位置,如標題標籤、黑體、H1等,說明頁面與關鍵字越相關...
檢索模組是實現檢索功能的程式,其作用是將用戶輸入的檢索表達式拆分成具有檢索意義的字或詞,再訪問查詢表,通過一定的匹配算法獲得相應的檢索結果。返回的結果一般根據詞頻和網頁連結中反映的信息建立統計模型,按相關度由高到低的順序輸出...
倒排列表就是文檔編號DocID,沒有包含其他的信息(如詞頻,單詞位置等),這就是簡單的索引。簡單索引功能可以用於小數據,例如索引幾千個文檔。然而它有兩點限制:(1)需要有足夠的記憶體來存儲倒排表,對’J幾搜尋引擎來說,都是G級別...
倒排列表就是文檔編號DocID,沒有包含其他的信息(如詞頻,單詞位置等),這就是簡單的索引。這個簡單索引功能可以用於小數據,例如索引幾千個文檔。然而它有兩點限制:1)需要有足夠的記憶體來存儲倒排表,對於搜尋引擎來說, 都是G級別...
倒排列表就是文檔編號DocID,沒有包含其他的信息(如詞頻,單詞位置等),這就是簡單的索引。這個簡單索引功能可以用於小數據,例如索引幾千個文檔。然而它有兩點限制:1)需要有足夠的記憶體來存儲倒排表,對於搜尋引擎來說, 都是G級別...
跨語言檢索技術的實現套用了信息檢索、文字處理、和機器翻譯等技術,如文字切分技術、辭彙翻譯、詞頻技術、索引技術等。發展歷程 跨語言信息檢索研究最早可追溯到1973年G. Salton先生Experiments in multilingual information retrieval一文的發表...
辭彙選擇上兼顧詞頻和實用性,參照中國媒體和海外漢語教材的詞頻統計結果,涵蓋社會生活真實場景中的常見元素。除名詞、動詞、形容詞外,還收錄大量詞組,方便學習者全方位掌握漢語辭彙。附中英文索引,中文索引中標出繁體字,方便不同地區的...
CiteSeer使用4種方法來識別和組織論文中的引文:①串位距或編輯位距測量;②詞頻或詞出現測量;③使用子欄位或數據結構知識;④機率方法。(3) 提問和瀏覽。CiteSeer使用關鍵字方式供用戶進行提問,搜尋文獻,搜尋後返回一個與提問相匹配的...
《單詞之間:考研辭彙解決方案》是2018年北京理工大學出版社出版的圖書。內容簡介 以詞根詞綴為基礎,以詞頻為線索,解析考研英語常考辭彙,解析細緻幽默。近2000核心詞 1400真題例句,音標、釋義、記法、考法、長難句語境和引申詞,循序...
《新東方中考英語歷年真題核心高頻688辭彙》是2020年浙江教育出版社出版的圖書。本書編者使用專業的詞頻軟體,從全國重點省、市、自治區的155套中考真題中精心篩選出688個高頻核心辭彙,並將這些辭彙按照考頻分為21個章節。