《文本自動標引與自動分類研究》是2009年12月東南大學出版社出版的圖書,作者是章成志、白振田、侯漢清。
基本介紹
- 中文名:文本自動標引與自動分類研究
- 作者:章成志、白振田、侯漢清
- ISBN:9787564119133
- 頁數:198頁
- 定價:25元
- 出版社:東南大學出版社
- 出版時間:2009年12月
- 裝幀:平裝
- 開本:32開
《文本自動標引與自動分類研究》是2009年12月東南大學出版社出版的圖書,作者是章成志、白振田、侯漢清。
《文本自動標引與自動分類研究》是2009年12月東南大學出版社出版的圖書,作者是章成志、白振田、侯漢清。內容簡介《文本自動標引與自動分類研究》總結了作者近年來在文本自動標引和,自動分類上所做的研究與實踐。全書由四部分構成...
自動標引屬於文本信息抽取的範疇。文本信息抽取是從文本數據中抽取人們關注的特定的信息。作用 由於關鍵字是表達檔案主題意義的最小單位,因此大部分對非結構化檔案的自動處理,如自動標引、自動文摘、自動分類、自動聚類、相關反饋、自動過濾、事件檢測與跟蹤、知識挖掘、信息可視化、概念檢索、檢索提示、關聯知識分析、自動...
(4)信息組織與檢索:本研究方向主要研究信息的採集、儲存和檢索的理論與方法,包括信息檢索理論、方法與實踐,如文本檢索、數據挖掘與知識發現、信息過濾、自動標引與分類、自動摘要等。(5)檔案管理理論與方法:本專業方向培養具備系統的檔案學知識,掌握套用型、複合型檔案管理專業力能的專門人才。人才培養 東南大學...
2.1 專利文本內容深度標註研究… ……… 5 2.1.1 專利獲取與清洗… ……… 6 2.1.2 專利句法分析… ………10 2.1.3 專利語料錯誤檢測… ………20 2.1.4 專利標引… ………34 2.2 專利動詞語義框架庫建設… ………39 2.2.1 物性結構… ………39 2.2.2 語義角色… ………40 2....
[2] 章成志. 多語言領域本體學習研究. 南京:南京大學出版社, 2012年10月.[3] 章成志,白振田(侯漢清主編). 文本自動標引與自動分類研究. 南京:東南大學出版社,2009年12月.出版圖書 學術論文 Qingqing Zhou, Rui Xia, Chengzhi Zhang*. Online shopping behavior study based on multi-granularity opinion ...
五、自動標引和自動分類的研究。六、專家系統和人工智慧的研究。七、機器翻譯的語料庫。八、綜合性或專業英漢詞典的編制與修訂。九、多語種敘詞表的研製。十、詞語知識庫的建立。其是目前國內版本最新、收詞最多、印刷最為精美的專業類工具書。是科技工作者必備的工具書。原國家科委主任宋健為此書題詞:出版大型辭書...
薛春香,女,1979年5月出生,南京理工大學經濟管理學院副教授、博士、碩士生導師。人物生平 學習經歷 2006年6月畢業於南京農業大學科學技術史專業(科技信息組織),獲得博士學位。研究方向 網路知識組織系統、文本分類、自動標引。主要成就 學術成就 出版專著1部,主編教材2部,參編教材1部,發表學術論文10餘篇。學術...
作為經驗定律,它仍有不足之處,有待進一步完善。意義 研究詞頻分布對編制詞表,制定標引規則,進行辭彙分析與控制,分析作者著述特徵具有一定意義。經驗表明,中頻詞往往是包含大量有檢索意義的關鍵字。而一篇文獻全文輸入計算機後,計算機是很容易檢出中頻詞的。因此,詞頻分布也是文獻自動分類、自動標引的研究對象。
多年來,索爾頓在自動化情報檢索的教學和研究工作中取得了很大成就。1961年主持建立了世界上第一個全自動文本處理和檢索的實驗性系統 SMART,該系統擴展了H.P.盧恩以計算機處理自然語言文本為基礎的標引和檢索概念。他在情報檢索理論模型、檢索策略和系統評價、自動標引和分類等方面都有重大建樹。他對圖書館學也有一定...
主要包括自動分類、自動標引和自動編制文摘。隨著信息技術和人工智慧技術的發展,情報加工作業將全面實現自動化。微型機、光碟技術和光纖通信的廣泛套用,將引起情報檢索技術重大的變革。情報檢索系統將實現智慧型化,可識別聲音、圖形和處理自然語言,亦可模仿人腦進行推理判斷和諮詢。相應地,情報檢索理論必將改觀,以研究知識...
108. 檔案主題標引實用算法《情報學報》1995(6)109. 計算機輔助立卷研究《檔案學研究》1995(3)110. 檔案自動分類算法研究《情報學報》1995(3)111. 檔案檢索自動化技術探討,《檔案與建設》1995.5 112. 漢語文獻信息自動標引新算法,信息技術與信息服務國際研討會,中國社會科學出版社,1994.10 113. 檔案管理自動化...
●國家社科基金項目:《中國分類主題詞表》研製(1988-1993)●國家社科基金項目:聯網環境中的情報檢索語言的兼容互換研究 (1998-2001)●江蘇社科基金項目:中文文獻資料庫詞表及標引技術(1998-2000)●國家社科基金項目:基於知識庫的中文網頁信息自動標引及自動分類(2002-2003)●國家社科基金項目——基於知識組織...
徵稿內容 1、大數據與數據挖掘技術; 2、海量信息存儲與壓縮技術; 3、資料庫新發展 4、概念檢索、語義檢索、圖像檢索、跨語言檢索、智慧型檢索; 5、信息自動抓取技術; 6、輿情收集、分析與監控技術; 7、知識搜尋平衡研究; 8、自動標引與自動分類技術; 9、情報分析前沿領域與創新方法; 10、語義網研究及相關...
它仍有不足之處,有待進一步完善。其他信息 研究詞頻分布對編制詞表,制定標引規則,進行辭彙分析與控制,分析作者著述特徵具有一定意義。經驗表明,中頻詞往往是包含大量有檢索意義的關鍵字。而一篇文獻全文輸入計算機後,計算機是很容易檢出中頻詞的。因此,詞頻分布也是文獻自動分類、自動標引的研究對象。
[10]張薇薇,王昊,朱曉東,網際網路用戶協同創作與內容共享的活動系統研究,中國圖書館學報,2011,(04):27-37.論文,2/3 [11]王昊,葉鵬,鄧三鴻,機器學習在中文期刊論文自動分類研究中的套用,現代圖書情報技術,2014,(03):80-87.論文,1/3 [12]王昊,鄒傑利,鄧三鴻,面向中文圖書的自動標引模型構建及實驗分析,現代...
部分字頻統計結果已經得出,從1977~1982年的1200多萬字的語料中統計出8969個不同的漢字,並提供了這些漢字根據不同學科分類的26種使用頻度表。辭海 由於詞的自動切分問題尚未解決,因而詞頻統計都是在人工調查統計或人工分詞的基礎上進行的。另外,中國文字改革委員會和武漢大學利用計算機對《辭海》1.6 萬多個漢字的...
[62]九十年代的信息經濟學研究動態. 中國信息經濟學會1995年年會, 1995年, 北京.[63]光碟技術及其套用進展. 《情報學年評》(第一卷). 1995.[64]多媒體技術和電子出版發展概況. 《電子出版》. 1995: 12, 1996: 1.[65]基於超文本結構的後控詞表管理系統. 《情報學報》. 1995: 5. 合著.[66]華語地區...
由於潛在語義索引可以計算出文檔間、文檔索引項間、文檔索引項和文檔間的相似度大小,在很多領域都可以得到運用,比如文本檢索、自動標引、文本摘要、信息過濾、雙語交叉過濾、垃圾郵件過濾、文本分類、個性化服務和用戶反饋、智慧型檢索等方面。文檔語義空間的表示 在套用潛在語義索引方法的時候,首先需要表示出文檔集合的語義...
多年來,索爾頓在自動化情報檢索的教學和研究工作中取得了很大成就。1961年主持建立了世界上第一個全自動文本處理和檢索的實驗性系統SMART,該系統擴展了H.P.盧恩以計算機處理自然語言文本為基礎的標引和檢索概念。他在情報檢索理論模型、檢索策略和系統評價、自動標引和分類等方面都有重大建樹。他對圖書館學也有一定...
第10章文本自動分類 10.1概述 10,2相關工作綜述與擴展閱讀 10.3算法流程 10.4文本表示模型 10.4.1基於主題詞向量模板的文本表示模型 10.4.2基於特徵詞哈希表的文本表示模型 10.5兩種輔助算法 10.5.1改進的向量內積算法 10.5.2改進的相似度算法 10.6類別中心向量分類算法 10.6.1算法主要步驟 10.6.2...
83.曹樹金,胡利勇.國外數字圖書館的信息組織與查詢研究.圖書館論壇,2004,(3):3-7 84.曹樹金,楊濤.自動分類在搜尋引擎性能最佳化中的套用.情報科學,2004,(2):213-219 85.胡岷,曹樹金.高校學生使用搜尋引擎之現狀分析.圖書館雜誌,2003,(6):60-63 86.曹樹金等.DDC、LCC、UDC網路版評析.中國圖書館...
7.5 相關研究比較 7.6 本章小結 第八章 ADL地理特徵詞表的自動豐富 8.1 引言 8.2 研究背景 8.3 算法設計 8.4 實驗及分析 8.5 結論和展望 參考文獻 下篇 圖書分類法自動分類研究 第九章 圖書分類法自動分類 9.1 研究內容 9.2 相關研究綜述 9.3 文本分類簡介 ……第十章 數據分析 第十一章 實驗...
自動文摘系統中的意義段劃分問題研究 漢語文本按語體分類的研究 基於概念的信息過濾技術探討 可分義原向量空間中的跨語種文本過濾模型 文本自動分類的模糊方法 基於改進的貝葉斯模型的中文網頁分類器 面向信息內容安全的文本過濾系統研究 基於規則和非規則方法的WEB信息提取 反饋方法在文本分類系統中的套用 詞距離的計算...
可以對各種已有的電子資源(如:TXT純文本,PDF、HTML、DOC等格式化文本,MARC數據,ODBC關係型數據,JPEG、TIF、BMP等圖像數據,MP3、MPEG等多媒體數據,各種資料光碟數據及其它國內自定義主流格式數據等)進行的批量處理、轉換、導入等獲取系統原始數據,再經過對數據進行(識別、壓縮、)裝訂、標引、校對、審核等深...
索引技術是搜尋引擎的核心技術之一。搜尋引擎要對所收集到的信息進行整理、分類、索引以產生索引庫,而中文搜尋引擎的核心是分詞技術。分詞技術是利用一定的規則和詞庫,切分出一個句子中的詞,為自動索引做好準備。索引多採用Non—clustered方法,該技術和語言文字的理解有很大的關係,具體有如下幾點:(1)存儲語法庫,...
14. 趙丹群,徐學文 文本信息處理技術的研究與進展 第15屆全國計算機信息管理學 術研討會論文集 內蒙古 海拉爾 2001年8月:238-245 15. 趙丹群,喀碧竹 試論搜尋引擎的技術改進 《情報理論與實踐》 2003年26卷2期:185-186,181 16. 趙丹群 信息檢索中敘詞表與Ontology的比較研究 《情報理論與實踐》 2006年 29...
KBase擁有超過500萬辭彙量的、大百科式的概念關係詞典,集成Smart TextMiner文本挖掘引擎和NLP自然語言處理引擎,可提供自動分類、自動聚類、關鍵字自動標引、自動文摘、信息過濾、關聯規則挖掘等多種實用功能。易用的檢索語言 KBase充分考慮用戶使用習慣,提供類似SQL的查詢語言—KSQL,設計更加人性化。完整的套用開發接口...
信息分類編碼 習題3 第4章 信息處理的自動化技術 信息處理的自動化發展歷程 自動標引技術 自動文摘技術 文獻自動分類技術 習題4 第5章 信息管理的資料庫 資料庫技術概述 傳統的信息資源資料庫 多媒體資料庫與非結構化資料庫 資料庫技術的新進展 第6章 文檔結構 兩類外存數據的組織 常用檔案的組織 超文本與流媒體...
3.1 標引 3.1.1 自動標引 3.1.2 基於辭彙分布特徵的標引方法 3.1.3 基於語言規則與內容的標引 3.1.4 人工智慧標引方法 3.2 聚類與分類技術 3.2.1 常用聚類方法 3.2.2 常用分類方法與技術 3.3 信息摘要技術 3.3.1 文本信息摘要的生成與實現技術 3.3.2 網頁信息摘要的生成與實現技術 3.3.3 ...
第四節 數字信息資源的標引與整合 一、數字信息資源標引與整合的含義 二、數字信息資源的分類標引與主題標引 三、非文本信息資源的標引與整合 四、異構數字資源庫的整合 第十章 信息組織的歷史發展與未來趨向 第一節 古代信息組織 一、信息組織產生的基礎 二、古代的信息組織 第二節 近代信息組織 一、近代國外信息...