《基於文本特徵計算的信息分析方法》是上海科學技術文獻出版社出版的圖書,作者是許鑫。
基本介紹
- 中文名:基於文本特徵計算的信息分析方法
- 作者:許鑫
- 出版時間:2015年11月1日
- 出版社:上海科學技術文獻出版社
- 頁數:236 頁
- ISBN:9787543968356
- 定價:45.00 元
- 裝幀:平裝
《基於文本特徵計算的信息分析方法》是上海科學技術文獻出版社出版的圖書,作者是許鑫。
《基於文本特徵計算的信息分析方法》是上海科學技術文獻出版社出版的圖書,作者是許鑫。...
進行如下三方面研究:1.從虛假商品評論信息的發布動機和行為出發分析其特徵規律;2.結合領域本體和條件隨機場模型進行可信度特徵的選擇及其特徵庫的構造,並據此構造規則集進行評論信息可信度文本特徵詞的自動抽取研究;這是研究重點。3.在上述基礎上,設計基於領域本體的評論信息可信程度計算規則,提出基於Jena推理機的...
1.《DINFO‑OEC文本分析挖掘方法與設備》特徵在於,包括以下步驟:對輸入文本進行概念提取和概念表達式識別;依據挖掘模型中的挖掘規則,對輸入文本的概念表達式進行分析挖掘;計算挖掘結果的可信度;按可信度輸出挖掘結果;挖掘結果可視化展示,其中所述挖掘模型包括3棵樹:本體樹:樹狀組織業務分類,為每個業務類型設定...
本項目基於計算語言學理論,構建上市公司年報領域本體,抽取上市年報文本信息規則,基於規則相似度對文本信息質量指標進行計量,建立綜合評價模型,對上市公司年報文本信息質量進行有效測度。本項目提出的測度方法不僅能拓展年報文本信息質量測度的深度和寬度,而且也可實現計算語言技術從通用語言的語法分析到專業領域語言的語義...
並對有用信息進行基於知識本體語義空間流形聚類的話題發現。最後利用特殊上下文實現話題情感計算以判別信息傾向。研究將有助於緩解短文本底層特徵稀疏性和頂層語義表達多義性間的矛盾,從而跨越語義鴻溝,解決短文本內容信息處理問題。結題摘要 目前網路輿情分析相關研究大多針對普通網路信息進行,忽視了以手機簡訊、即時訊息...
針對現有的蛋白質互動關係識別方法中對單句信息以及標註數據的依賴等問題,本項目以大規模文本庫中提取的蛋白質對描述上下文為依據,綜合不同語言分析層次的特徵,設計了基於關係相似性的計算模型建立蛋白質對之間的語義相似性約束,對蛋白質對關係作出判斷。主要研究內容包括:(1)基於上下文的蛋白質互動關係的文本特...
3.14 基於辭彙的統計學建模方法 83 3.15 本章小結 86 第4章 文本分類 88 4.1 文本分類的基本概念 88 4.2 文本分類的套用場景 89 4.2.1 文檔有用性判斷 89 4.2.2 口碑情感分析 90 4.2.3 負面信息識別 90 4.2.4 信息檢索 90 4.3 樸素貝葉斯模型 91 4.3.1 ...
針對作者身份歸屬識別問題,設計了一種基於序列最小最佳化的原始碼作者身份歸屬識別方法,以及一種基於深度信念網路模型的原始碼作者身份歸屬識別方法。在自然語言文本的作者身份歸屬識別方面,研製了一種決策級中文分詞融合方法;提出了一種基於特徵最佳化的文本相似度計算方法。另外,分析了文本挖掘和自然語言處理研究領域相關...
第4章 基於話題跟蹤的消費品質量安全信息分析 4.1 話題跟蹤研究現狀 4.1.1 相關概念 4.1.2 研究現狀 4.2 質量安全事件Web新聞話題跟蹤模型構建 4.2.1 Web文檔預處理 4.2.2 特徵選擇和文本表示 4.2.3 特徵權重計算 4.2.4 Single-Pass增量聚類算法 4.3 改進的相似度計算方法 4.3.1...
2.2 文本表示方法 2.3 常用的文本特徵權重計算方法 2.4 文本特徵選擇簡介 2.5 所提的文本特徵選擇方法 2.6 實驗仿真驗證 2.7 本章小結 第3章 文本分類 3.1 引言 3.2 文本分類的定義 3.3 常用的文本分類器 3.4 基於粗糙集理論的文本分類研究 3.5 ID3算法的最佳化 3.6 本章小結 第4章 ...
利用節點綜合特性提取反映文本主題的關鍵字作為文本的特徵詞,以最佳化文本網路結構,降低文本網路複雜性。引入知網和維基百科在複雜網路表示文本表示下進行文本相似度計算,以此減少語義流失。運用開放的語料庫進行實驗,結果表明這些方法都有效的提高了文本分類精度並實現了語義層次的文本信息的深度挖掘。
該研究能從語義演化角度體現抽取特點,通過數據特徵歸納刻畫抽取需求,基於查詢處理實現抽取計算,利用本體信息驅動抽取任務,構建實用系統驗證抽取方法,具有較強的理論價值與廣闊的套用前景。結題摘要 當前各行業領域普遍存在大量的非結構化文本數據需要抽取出結構化語義信息並進行管理。如何構建適應大規模領域數據的語義信息...
3.14 基於辭彙的統計學建模方法 83 3.15 本章小結 86 第4章 文本分類 88 4.1 文本分類的基本概念 88 4.2 文本分類的套用場景 89 4.2.1 文檔有用性判斷 89 4.2.2 口碑情感分析 90 4.2.3 負面信息識別 90 4.2.4 信息檢索 90 4.3 樸素貝葉斯模型 91 4.3.1 貝努利模型 91 4.3.2 多項式...
基於內容的圖像檢索,即CBIR(Content-based image retrieval),是計算機視覺領域中關注大規模數字圖像內容檢索的研究分支。典型的CBIR系統,允許用戶輸入一張圖片,以查找具有相同或相似內容的其他圖片。而傳統的圖像檢索是基於文本的,即通過圖片的名稱、文字信息和索引關係來實現查詢功能。這一概念於1992年由T.Kato提出...
詞語的情感是句子或篇章級情感分析的基礎。早期的文本情感分析主要集中在對文本正負極性的判斷。詞語的情感分析方法主要可歸納為三類:(1)基於詞典的分析方法;(2)基於網路的分析方法;(3)基於語料庫的分析方法。基於詞典的分析方法利用詞典中的近義、反義關係以及詞典的結構層次,計算詞語與正、負極性種子辭彙之間的...