主題聚類(topic clustering)是2019年公布的圖書館·情報與文獻學名詞。
基本介紹
- 中文名:主題聚類
- 外文名:topic clustering
- 所屬學科: 圖書館·情報與文獻學
- 公布年度:2019年
- 屬性:圖書館·情報與文獻學名詞
主題聚類(topic clustering)是2019年公布的圖書館·情報與文獻學名詞。
主題聚類(topic clustering)是2019年公布的圖書館·情報與文獻學名詞。定義融合信息組織方法中的主題法與數據挖掘中的聚類方法形成的一種特殊的知識組織方法,可作為信息資源的一種組織模式。通過對聚類對象進行主...
《主題聚類及其套用研究》是2013年4月國家圖書館出版社出版的圖書,作者是章成志。內容簡介 《主題聚類及其套用研究》對主題聚類理論、方法、若干關鍵技術以及套用進行了全面的研究,主要內容包括:自動標引的研究歷史、研究方法,並利用當前...
將每個主題詞自動添加入形式背景的屬性集中,採用並行搜尋算法實現對語義大數據的最佳化聚類算法改進。仿真實驗進行了性能驗證,研究結果表明,採用本文算法能有效提高大數據聚類性能,聚類的切合度較好,誤分率較低。
鑒於可比語料易獲取、易與領域兼容,且多語言相似詞在可比語料上有相似語境分布,本項目將可比語料用於多語言文本聚類,擬以申請者已開發的主題聚類原型系統為基礎,進行如下三方面研究:1.結合短語分析和機器學習,提取多語言文本主題;2....
主題模型(topic model)是以非監督學習的方式對文集的隱含語義結構(latent semantic structure)進行聚類(clustering)的統計模型。主題模型主要被用於自然語言處理(Natural language processing)中的語義分析(semantic analysis)和文本挖掘(...
1.1.2 基於連結分析的主題聚類 1.1.3 基於複合網頁特徵的主題聚類 1.1.4 基於巨觀網路拓撲結構的Web主題社區發現 1.1.5 基於Web訪問日誌的用戶社區發現 1.1.6 基於Web主題圖的信息瀏覽和檢索可視化 1.2 研究意義 1....
此外,該研究成果所帶來的潛在套用價值不勝枚舉,例如挖掘全球資訊網中的社團,實現Web文檔的主題聚類,而且對提高網路搜尋的性能,實現信息過濾、熱點話題跟蹤,網路輿情分析,客戶群挖掘,犯罪核心監控等均有重要作用。本項目的研究具有深刻的...
根據上述描述,利用領域本體和圖算法對語義描述進行進一步的精化;2、研究新型的Web圖像表示下的圖像平面和層次聚類算法,以及通過聚類進行面向主題的圖像聚類和對事件與熱點的發現算法;3、研究根據Web多媒體網頁自身的特點和分類信息,利用...
並針對多核處理器、耦合CPU-GPU結構下的大數據挖掘進行了詳細分析;設計並實現了基於LDA主題模型的空間聚類算法,分析該算法在處理空間大數據時的優劣表現,進而基於深度學習及遷移學習方法,提出一種全新的基於Siamese網路的空間圖像聚類算法...
Newsblaster將每天發生的重要新聞文本進行聚類處理,並對同主題文檔進行冗餘消除、信息融合、文本生成等處理,從而生成一篇簡明扼要的摘要文檔;②對搜尋引擎返回的結果進行聚類,使用戶迅速定位到所需要的信息。Hua-Jun Zeng等人提出了對搜尋...
5.2.2有副主題限定詞的主題分布127 5.2.3無副主題限定詞的主題分布127 5.3學科主題表示學習129 5.3.1基於網路結構的學科主題表示學習129 5.3.2基於文本內容的學科主題表示學習136 5.4學科主題聚類和演化分析139 5.4.1聚類方法...
本項目的主要目標是開發出高性能的聚類算法,從而為生物醫學研究人員查找信息提供便利。項目順利完成,基於信息融合思想,有機融合生物醫學文本的多種重要信息如內容信息、生物醫學文本特有的語義信息(人工標註的醫學主題詞)和文獻引用信息等...
《三維形變目標內蘊特徵提取與聚類分析》是趙傑煜為項目負責人,寧波大學為依託單位的面上項目。科研成果 項目摘要 三維圖像分析可以有效克服光照和姿態變化的影響,其面臨的主要挑戰是目標運動引起的形變影響。本項目通過對曲面測地線特徵的...
旨在模擬決策人員思維模式,給出主動確定數據挖掘主題、任務及相關數據組織策略的結構化方法。研究內容包括:.(1)思維單元的結構化建模技術,形式化表示思維單元及其之間的聯繫。.(2)思維分析主題發現方法,包括思維序列抽取、思維序列聚...
國內研究主題的聚類分析 聚類一:循證醫學理念在循證社科領域的套用,包括在循證決策、循證實踐和循證科學的套用;聚類二:循證決策、決策支持和衛生政策的實施等;聚類三:循證實踐、循證管理、研究證據、循證心理治療及證據評估等;...
研究領域主要包括信息組織、信息檢索、文本挖掘及自然語言處理等,主要的研究方向為多語言文本挖掘、多語言領域本體學習、主題聚類及其套用、關鍵字自動提取、術語自動提取、跨語言信息處理與檢索等。主要成就 研究領域 曾參與或主持的項目包括...
在專利知識相似度和新穎度基礎上進行專利的主題聚類;最後,構造基於知識主體的競爭網路和基於知識客體的共詞網路,按照時間維度,研製專利知識演化圖譜,進行熱點專利識別、專利機會發現和專利趨勢預測,建立可視化的專利挖掘平台。結題摘要 專...
14 詞語按主題聚類 / 104 14.1 程式操作圖示 / 104 14.1.1 打開、保存資料夾 / 104 14.1.2 選擇聚類的底表和詞語數 / 105 14.1.3 單擊運行程式 / 105 14.2 統計結果展示 / 105 15 篇章風格統計分析 / 107 15...
該模型經由連結關係矩陣、彩色連結表、CK編碼技術,從設計過程發展和概念空間演化兩個維度分析團隊設計過程,提升連結表的局部推理和表達功能,並利用自然語言理論和確定性信息理論開展認知複雜性、一致性和集聚性分析、概念主題聚類分析。同時...
7.4.4案例4: 通過LDA主題模型進行主題聚類 本章小結 習題7 第8章計算機視覺 8.1計算機視覺基礎 8.1.1計算機視覺簡史 8.1.2圖像形成 8.2識別 8.2.1圖像分類 8.2.2目標檢測 8.2.3圖像分割 8.2.4視頻理解 8.2.5案例1...
4.3.3 基於主題聚類識別多義術語 62 4.4 基於動態場景知識的領域術語非分類關係建模 67 4.4.1 共享環境內動態場景建模 68 4.4.2 基於動態場景知識的多義領域術語標註 70 4.4.3 術語語用情境標註實例分析 73 4.5 本章小結 ...
我們我們建立了隨時間變化的主題模型並檢測主題變點;使用最佳化方法,建立了聚類的多元聯合 Poisson 模型,對文本進行聚類和分類分析,融入了詞語間的結構信息;研究了線性判別分析方法和最小二乘的關係,然後利用稀疏最小二乘解決高維稀疏...
根據不同的聚類水平的要求,可以形成不同聚類層次的類目體系。在這樣的類目體系中,主題相近、內容相關的文獻便聚在一起,而相異的則被區分開來。聚類檢索的出現,為文獻檢索尤其是計算機化的信息檢索開闢了一個新的天地。文獻自動聚類...
北京方正電子政務技術有限公司推出的方正智思輿情預警輔助決策支持系統,以整合網際網路搜尋技術及信息智慧型處理技術,通過知識管理的方法,對網際網路海量信息進行自動抓取、自動分類、自動聚類、主題檢測、專題聚焦,基本信息 方正網際網路輿情分析 許...
第7章 文本聚類 129 7.1 聚類的基本問題 129 7.2 文本聚類的算法 130 7.3 文本聚類的評價 134 7.4 套用案例:研討文本的主題聚類 135 7.5 實驗:使用K-means算法對文本進行聚類 142 思考題 148 第8章 主題模型 149 8.1 ...
樂思輿情監控系統是深圳市樂思軟體研發的,依託自主的網頁採集技術和信息整理挖掘技術,通過網頁內容的自動採集處理、敏感詞過濾、智慧型聚類分類、主題檢測、專題聚焦、統計分析等多個環節,實現相關網路輿情監督管理的需要,最終形成輿情專報、...
第9章 使用機率模型進行聚類130 9.1 混合模型與聚類130 9.1.1 數據團塊的有限混合模型130 9.1.2 主題和主題模型132 9.2 EM算法133 9.2.1 例子——高斯混合:E步134 9.2.2 例子——高斯混合:M步136 9.2.3...
面向查詢的多文檔自動文摘將查詢結果文檔集合的內容提煉為包含與查詢相關的主題、滿足個性化需求的摘要,它能夠顯著提高信息獲取和利用的效率。本項目的研究策略有以下特色:提出了文本、段落兩階段聚類發現潛在子主題的策略;設計了五種文摘...
輿情系統需要綜合運用搜尋引擎技術、文本處理技術、知識管理方法、自然語言處理、手機簡訊平台,通過對網際網路海量信息自動獲取、提取、分類、聚類、主題監測、專題聚焦,以滿足用戶對網路輿情監測和熱點事件專題追蹤等需求。系統概況 輿情系統集成...