漢語文本數據挖掘的統計方法

漢語文本數據挖掘的統計方法

《漢語文本數據挖掘的統計方法》是依託東北師範大學,由郭建華擔任項目負責人的數學天元基金項目。

基本介紹

  • 中文名:漢語文本數據挖掘的統計方法
  • 項目類別:數學天元基金項目
  • 項目負責人:郭建華
  • 依託單位:東北師範大學
  • 批准號:10826110
  • 申請代碼:A0403
  • 負責人職稱:教授
  • 研究期限:2009-01-01 至 2009-12-31
  • 支持經費:10(萬元)
項目摘要
漢語文本的急劇增多使得其有效處理成為政界、管理學界面臨的一個極具挑戰性的問題。自2005年5月始,申請者與長春市政府市長公開電話辦公室長期密切合作,研究電話投訴案例的分類匯集、分析整理工作,以期找出規律性的問題,並從中發現工作中的薄弱環節,為改進工作、制定決策提供重要依據。為此聯合開發了智慧型化綜合服務平台。 市長公開電話數據的顯著特點是數據量大、數據維度高、數據採集環境複雜、分析目標經常變化等。這是現代統計面臨的最大挑戰。在此問題的驅動下,本項目主要研究無監督(公開電話)語料庫的建立方法、高精度的雙維度分類(聚類)方法、投訴預警預報方法、以及新模式的探測方法,使市長公開電話工作模式從原來的依賴人員素質型向智慧型服務型轉變,從過分依賴經驗型向科學數據支撐型轉變,實現市長公開電話工作管理的效能化、精細化、數位化和正規化。

相關詞條

熱門詞條

聯絡我們