《面向全基因組關聯研究的動態數據挖掘與深度查詢方法》是依託中南大學,由裘嶸擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:面向全基因組關聯研究的動態數據挖掘與深度查詢方法
- 項目類別:青年科學基金項目
- 項目負責人:裘嶸
- 依託單位:中南大學
項目摘要,結題摘要,
項目摘要
本項目針對全基因組關聯研究 (Genome-wide association studies, GWAS) 的Deep Web數據量大、信息更新不定期、更新數據比例小、內容專題性強等特點,提出一種面向GWAS的動態數據挖掘與深度查詢方法。在Deep Web信息集成過程中,研究定位數據源的聚焦爬蟲、動態抓取數據的感應器和深度查詢集成這三者協調運行的設計與實現方法,以解決高效、準確地對GWAS數據進行動態數據挖掘與深度查詢問題;建立抹炒籃面向GWAS的深度查詢數據集成實驗系統,進行動態數據挖掘與深度查詢的套用研究。本項目將為面向GWAS的Deep Web動態數據挖掘與深度查詢提供快速有效的方法,為研究與網路相關聯的生物資料庫查詢和處理問題提供新的有效途徑,推動生物信息學網路數據挖掘、數據集成和信息融合的進一步發展。
結題摘要
隨著生命科學技術的與現代信息技術的拘記朽蓬勃發展,基於生命組學的大數據的積累與套用均已達到前所未有的程度,多元的生物資料庫資源在生物化學與生物分子學研究中得到了廣泛的套用。其中,全基因組關聯研究(GWAS)在發現大量複雜疾病或性狀的相關變異和易感基因方面有重頁想企估要作用,因此GWAS數據已成為生物基因組研究領域的重要數據來源之一。由於面向GWAS的Deep Web資料庫具有數據量大、數駝嚷婆騙據類型多樣、數據更新動態等特點的客觀原因,以及從事生物信息的研究者受制於專業背景和研究側重點不同而使得他們對生物資料庫資源的分析、處理和整合能力存在不足,制約了他們對已有數據資源充分與有效地利用等的主觀原因,因此,對於面向GWAS的Deep Web數據集成研究勢在必行。針對面向才拔GWAS的Deep Web數據的諸多特點與現有挑戰,本項目提出了一種姜潤跨面向GWAS的數據集成系統記轎民架構的方法,通過對Deep Web信息集成過程中定位數據源的聚焦爬蟲、動態抓取數據的感應器和深度查詢集成三者協調運行的設計與實現,實現高效、準確地套用Deep Web中的GWAS數據深度查詢的問題。通過對現有挑戰的分析,我們採用數據源發現、動態數據更新以及數據集成等策略,旨在解決面向GWAS的數據研究上由於主客觀原因造成對信息資源利用的制約的問題,研究成果對全基因組關聯分析的基礎研究與轉化套用起到很大的助推作用。