《大數據分類模型和算法研究》是2020年雲南大學出版社出版的圖書,作者是劉寶锺。
基本介紹
- 書名:大數據分類模型和算法研究
- 作者:劉寶锺
- 出版社:雲南大學出版社
- 出版時間:2020年1月1日
- ISBN:9787548236139
《大數據分類模型和算法研究》是2020年雲南大學出版社出版的圖書,作者是劉寶锺。
《大數據分類模型和算法研究》是2020年雲南大學出版社出版的圖書,作者是劉寶锺。內容簡介《大數據分類模型和算法研究》強調了大數據的寶貴价值,論述了常用的數據分析技術與方法,在此基礎上設計對應的大數據分類模型(線性分類模型...
《面向多源大數據的魯棒聚類模型與算法研究》是依託山西大學,由杜亮擔任項目負責人的青年科學基金項目。項目摘要 多源大數據的聚類分析是大數據研究面臨的重要問題之一。由於數據規模大來源廣,多源大數據聚類不得不面對數據中廣泛存在複雜噪聲。現有方法從不同角度進行多源聚類,如多視圖聚類、聚類集成、多核聚類和多關係...
大數據技術是當前研究與行業套用的熱門問題;新聞信息是大數據時代的一個典型案例;個性化推薦用於解決新聞信息過載和信息迷航問題。結合數據量大、數據類型繁多、時效性嚴、準確度高的大數據特徵,課題提出新的推薦模型和方法,並開發完整的新聞推薦平台,完成理論、技術、算法和平台建設四個方面的工作。主要創新點包括:(...
《大數據共性最佳化模型的高效算法研究》是依託西安電子科技大學,由王宇平擔任項目負責人的面上項目。中文摘要 大數據領域中的很多套用問題可以建成共同類型的最佳化模型:大規模複雜全局最佳化模型和超多目標最佳化模型。這些模型的本質特徵是:大規模、複雜(大量局部最優解)、超多目標。已有算法具有如下缺陷:效率低、能力差(...
大數據環境下的高維數據流在無線感測網路、移動通信、社交網路以及生物信息等領域有廣泛的套用前景,是當前數據挖掘領域的重要研究方向。由於大數據環境下高維數據流存在維數災難及數據分布不穩定等問題,傳統方法尚難以對如此複雜的數據進行深入的處理和挖掘。本項目研究大數據環境下高維數據流的降維、概念漂移檢測、分類及...
《架構大數據——大數據技術及算法解析》是2015年6月電子工業出版社出版的圖書,作者是趙勇。內容簡介 本書從大數據架構的角度全面解析大數據技術及算法,探討大數據的發展和趨勢。不僅對大數據相關技術及算法做了系統性的分析和描述,梳理了大數據的技術分類,如基礎架構支持、大數據採集、大數據存儲、大數據處理、大數據展示...
《多粒度視角下大規模數據聚類算法研究》是依託山西大學,由趙興旺擔任項目負責人的青年科學基金項目。項目摘要 聚類分析作為大數據信息粒化及信息壓縮的一個基本工具,開展大數據聚類分析新理論與新方法具有重要的意義。本項目針對大數據規模的海量性特徵對聚類分析任務提出的可計算性、有效性、高效性等挑戰,將多粒度建模...
數理統計學中的變係數模型是研究該數據類型的一個很好的工具,能夠詳細刻畫協變數與時間變數的相互關係,解釋事物隨時間演化的規律。但現有的研究成果還基本上局限在小數據/小世界的理論和算法,不能真正滿足大數據分析的需要。本項目將在梳理傳統變係數模型研究成果的基礎上,主要針對實時流數據的多分類問題,從基礎模型...
《教育大數據算法模型與套用》是一本2021年出版的圖書,由科學出版社出版 內容簡介 在數據密集型研究範式下,數據在教育科學研究和發現中的地位日益提升。本書詳細介紹了教育大數據的採集、存儲、分析等技術,繼而研究了區域網路教學資源聯盟、網路教學資源調查、教育信息化行業熱點話題分析及趨勢預測、基礎教育概念圖自動...
《大數據最佳化建模與算法》是2021年西安電子科技大學出版社出版的圖書。內容簡介 大數據最佳化建模及求解最佳化模型的算法設計是解決大數據問題的關鍵技術。本書選擇信息學科領域一些典型的大數據問題,介紹這些問題的最佳化建模方法,並對這些最佳化模型進行分類,分別介紹求解各類最佳化模型的算法。本書共分為六章。章詳細介紹了10個...
首先將研究生物醫學文獻基於MapReduce的文本分類方法,提出基於MapReduce的並行化生物醫學命名實體識別的模型訓練及模型推斷算法,並在此基礎上對生物醫學文本中的疾病和相關實體進行規範化標註。其次將提出生物醫學文本中與疾病相關的語義關係挖掘和假設生成並行算法,構建基於文本大數據的疾病關係網路,為實現對疾病之間、疾病...
提出了有效的高維數據的可視化方法,包括:基於ANNOY算法的快速近鄰搜尋算法、基於近鄰關係與類別信息的機率重構算法、基於P-BGLL的可視化算法、基於Feature-Net的可視化算法。基於正常人眼底視網膜圖像的大數據集合,研究了視網膜眼底圖像中各類異常的智慧型檢測方法。在三維圖像數據的可視化方面,針對圖像中屬性相似的結構難以分離...
全書總計21章,內容包括十大數據分類算法、十大從二元分類到多類分類的算法、九大屬性選擇算法、五大數據選擇算法,若干集成學習方法和不均衡數據分類算法,以及大數據分析的平台與技術。 本書可作為高等學校計算機科學與技術、數據科學與大數據技術、統計學、軟體工程、地理信息系統等專業的研究生和高年級本科生的教材,也...
進行語義本體模型構建,為離群點新建一個簇,依次對每個文檔的主題詞集進行處理,將每個主題詞自動添加入形式背景的屬性集中,採用並行搜尋算法實現對語義大數據的最佳化聚類算法改進。仿真實驗進行了性能驗證,研究結果表明,採用本文算法能有效提高大數據聚類性能,聚類的切合度較好,誤分率較低。
網路大數據環境下,傳統的圖像隱寫分析方法面臨挑戰。當前深度學習被廣泛用於圖像分類和識別領域,取得顯著進展,也被用於隱寫分析的最新研究。相比淺層特徵提取方法,深度學習被寄予希望構造出表達能力更強的深度隱寫特徵。但是,現有深度隱寫分析方法存在深度隱寫特徵學習模型針對性不足、載體多樣化導致的失配和未知隱藏算法...
《大數據分析與挖掘》是人民郵電出版社2022年出版的書籍。內容簡介 《大數據分析與挖掘》主要內容包括:第 1章緒論、第 2章數據特徵分析與預處理、第3章關聯規則挖掘、第4章分類算法、第5章聚類算法、第6章分散式大數據流挖掘、第7章 綜合案例——基於華為技術與設備。本書可作為高等院校數據科學與大數據技術、...
經典算法 目前,數據挖掘的算法主要包括神經網路法、決策樹法、遺傳算法、粗糙集法、模糊集法、關聯規則法等。神經網路法 神經網路法是模擬生物神經系統的結構和功能,是一種通過訓練來學習的非線性預測模型,它將每一個連線看作一個處理單元,試圖模擬人腦神經元的功能,可完成分類、聚類、特徵挖掘等多種數據挖掘任務...
《大數據分析與計算》是2018年3月清華大學出版社出版的圖書,作者是湯羽、林迪、范愛華、吳薇薇。內容簡介 大數據套用已成為行業熱點和產業發展新增長點,數據科學與計算技術也是最新的前沿領域,其中,大數據計算分析提供了核心的技術支撐。本書從大數據計算系統的三個層次對數據模型、處理算法、計算模型與架構、開發技術...
《大數據時代的算法:機器學習、人工智慧及其典型實例》是2017年1月電子工業出版社出版的圖書,作者是劉凡平。內容提要 《大數據時代的算法:機器學習、人工智慧及其典型實例》介紹在網際網路行業中經常涉及的算法,包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機器學習相關的算法,包括數據分...
第10章大數據挖掘/247 知識結構247 10.1大數據挖掘概述247 10.1.1數據統計分析與數據挖掘的主要區別248 10.1.2數據挖掘的定義與相關概念248 10.1.3數據挖掘的理論基礎248 10.1.4基於數據存儲方式的數據挖掘249 10.2關聯規則251 10.2.1關聯規則生成描述251 10.2.2頻繁項目集生成算法252 10.3分類256 10.3...
此外,還有很多其他的算法,如Zhang.J於2014年提出的一種基於粗糙集的最佳化算法、Wang.R在2015年提出的基於極端學習樹的算法模型等。隨機森林(RF)作為機器學習重要算法之一,是一種利用多個樹分類器進行分類和預測的方法。近年來,隨機森林算法研究的發展十分迅速,已經在生物信息學、生態學、醫學、遺傳學、遙感地理學...