《數據與文本挖掘及其在研發決策中的套用》是2011年12月1日經濟管理出版社出版的圖書,作者是郝占剛。
基本介紹
- 中文名:數據與文本挖掘及其在研發決策中的套用
- 作者:郝占剛
- 出版社:經濟管理出版社
- 出版時間:2011年12月1日
- 頁數:155 頁
- 開本:16 開
- ISBN:9787509608555
- 外文名:Data and Text Mining and Its Application in Research and Development Decision-ma
- 語種:簡體中文
《數據與文本挖掘及其在研發決策中的套用》是2011年12月1日經濟管理出版社出版的圖書,作者是郝占剛。
教材系統地介紹文本數據挖掘的相關概念,利用Python作為工具進行相關試驗,其內容主要包括:文本挖掘產生的背景及發展;文本挖掘的概念、文本模型表示、文本內容的預處理,包括分詞、去停用詞以及特徵抽取;文本相似度的概念等。介紹文本分類的概念及常用方法,如KNN算法、SVM算法等,並對分類結果進行評價;在介紹文本聚類...
《文本挖掘概論:研究設計、數據收集與分析》,是2023年重慶大學出版社出版的圖書,作者是加布·伊格納托、拉達·米哈爾恰。內容簡介 該書共分為六個部分:基礎入門、研究設計和基礎工具、文本挖掘基礎、人文社會科學與文本分析、計算機科學與文本挖掘、寫作和展示,在內容安排上由淺入深、循序漸進。相較於單一且詳盡的...
雖然已有國內外的研究者對時空文本數據進行過研究,但這些研究工作主要集中在時空信息查詢,沒有關於時空情感分析的研究。本項目深入探究時空文本數據中文本的情感傾向與發布位置,發布時間之間聯繫,在時間和空間維度上來進一步挖掘用戶的情感特徵,重點研究了情感分析在推薦系統中的套用。傳統的情感分析方法難以直接運用到...
理論統計學的研究為套用統計學的數量分析提供方法論基礎,大大提高了統計分析的認識能力,而套用統計學在對統計方法的實際套用中,又常常會對理論統計學提出新的問題,進一步開拓了理論統計學的研究領域。 隨著科學技術的進步,數據已經演變成包括數字、影像、聲音、文本等在內的各種信息的載體。電子科技尤其是網際網路的發展...
實驗室前身是復旦大學數據科學研究中心,成立於2007年,是國內首個致力於數據科學理論、方法和技術研究的機構,發表了一批高質量的論文。實驗室也重視技術套用,涉及金融、智慧型交通、醫療健康、智慧城市等多領域的大數據分析。作為數據科學的倡導者,2009年發表了題為“Data Explosion, Data Nature and Dataology”的數據...
其中第11~15章介紹生產套用實踐,涵蓋關聯分析、用戶畫像、推薦算法、文本挖掘、人工神經網路。這些也是工業界和學術界研究的熱點。第16章講解了著名的大數據框架及其安裝與配置,如Hadoop、Spark、Cassandra、PrestoDB。第17章從速度與穩定性維度介紹了大數據系統的架構與調優。第18章則從數據運營、評估、展現與變現場...
029 問題一:如何對數據進行預處理?035 問題二:如何完成統計分析?036 問題三:如何進行聚類?038 問題四:如何完成預測?042 問題五:如何進行關係挖掘?046 問題六:如何進行社會網路分析?048 問題七:如何進行文本挖掘?050 問題八:如何開展教學視頻分析?054 問題九:什麼是數據可視化及其基本要素?第三...
■ 山東省自然科學基金項目(青年基金)《基於數據挖掘及進化算法的技術創新進化研究(ZR2009HQ005)》(在研項目,主持)。主要論文 1 郝占剛,王正歐,基於模式聚類和遺傳算法的文本特徵提取方法,計算機套用,2005,7.2 郝占剛,王正歐,基於潛在語義索引和遺傳算法的文本特徵提取方法,情報科學,2006,1.3 郝占剛,...
另外,在大數據時代,隨著數據產生速度的持續加快,數據的體量有了前所未有的增長,而需要分析的新的數據種類也在不斷湧現,如文本的理解、文本情感的分析、圖像的檢索和理解、圖形和網路數據的分析等。使得大數據機器學習和數據挖掘等智慧型計算技術在大數據智慧型化分析處理套用中具有極其重要的作用。在2014年12月中國計算...