主題聚類(topic clustering)是2019年公布的圖書館·情報與文獻學名詞。
基本介紹
- 中文名:主題聚類
- 外文名:topic clustering
- 所屬學科: 圖書館·情報與文獻學
- 公布年度:2019年
- 屬性:圖書館·情報與文獻學名詞
主題聚類(topic clustering)是2019年公布的圖書館·情報與文獻學名詞。
《主題聚類及其套用研究》是2013年4月國家圖書館出版社出版的圖書,作者是章成志。內容簡介 《主題聚類及其套用研究》對主題聚類理論、方法、若干關鍵技術以及套用進行了全面的研究,主要內容包括:自動標引的研究歷史、研究方法,並利用當前...
主題模型(topic model)是以非監督學習的方式對文集的隱含語義結構(latent semantic structure)進行聚類(clustering)的統計模型。主題模型主要被用於自然語言處理(Natural language processing)中的語義分析(semantic analysis)和文本挖掘(...
鑒於可比語料易獲取、易與領域兼容,且多語言相似詞在可比語料上有相似語境分布,本項目將可比語料用於多語言文本聚類,擬以申請者已開發的主題聚類原型系統為基礎,進行如下三方面研究:1.結合短語分析和機器學習,提取多語言文本主題;2....
①文檔聚類可以作為多文檔自動文摘等自然語言處理套用的預處理步驟,比較典型的例子是哥倫比亞大學開發的多文檔文摘系統Newsblaster。Newsblaster將每天發生的重要新聞文本進行聚類處理,並對同主題文檔進行冗餘消除、信息融合、文本生成等處理,從而...
5.2.2有副主題限定詞的主題分布127 5.2.3無副主題限定詞的主題分布127 5.3學科主題表示學習129 5.3.1基於網路結構的學科主題表示學習129 5.3.2基於文本內容的學科主題表示學習136 5.4學科主題聚類和演化分析139 5.4.1聚類方法...
《雙語語料構建與雙語文本聚類研究》是2019年6月南京大學出版社出版的圖書,作者是章成志。內容簡介 《雙語語料構建與雙語文本聚類研究》以多語言文本為研究對象,進行基於多語言文本的文本挖掘,涉及任務主要分為三塊內容,多語言文本的採集...
利用層次主題模型和聚類分析,對圖書主題粗結構劃分得到的最小邏輯單元進行層次主題結構劃分及主題標引,然後,通過基於機率主題模型的主題信息抽取方法,抽出圖書主題粗結構中各邏輯單元的主題信息,實現圖書層次主題自動標引,以細化圖書信息...
研究領域主要包括信息組織、信息檢索、文本挖掘及自然語言處理等,主要的研究方向為多語言文本挖掘、多語言領域本體學習、主題聚類及其套用、關鍵字自動提取、術語自動提取、跨語言信息處理與檢索等。主要成就 研究領域 曾參與或主持的項目包括...
在專利知識相似度和新穎度基礎上進行專利的主題聚類;最後,構造基於知識主體的競爭網路和基於知識客體的共詞網路,按照時間維度,研製專利知識演化圖譜,進行熱點專利識別、專利機會發現和專利趨勢預測,建立可視化的專利挖掘平台。結題摘要 專...
6.2.3關鍵字主題聚類 6.3圖像語義標註 6.3.1特徵提取 6.3.2語義標註模型 6.4基於語義標註的圖像檢索 6.5基於語義標註的圖像檢索性能比較 6.5.1圖像特徵 6.5.2相似度度量方法 6.5.3性能指標 6.5.4實驗數據 6.5.5實驗...
14 詞語按主題聚類 / 104 14.1 程式操作圖示 / 104 14.1.1 打開、保存資料夾 / 104 14.1.2 選擇聚類的底表和詞語數 / 105 14.1.3 單擊運行程式 / 105 14.2 統計結果展示 / 105 15 篇章風格統計分析 / 107 15...
第7章 文本聚類 129 7.1 聚類的基本問題 129 7.2 文本聚類的算法 130 7.3 文本聚類的評價 134 7.4 套用案例:研討文本的主題聚類 135 7.5 實驗:使用K-means算法對文本進行聚類 142 思考題 148 第8章 主題模型 149 8.1 ...