《基於標點信息和樹形結構的漢語韻律結構研究》是依託山西大學,由錢揖麗擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於標點信息和樹形結構的漢語韻律結構研究
- 項目類別:青年科學基金項目
- 項目負責人:錢揖麗
- 依託單位:山西大學
- 批准號:61005053
- 申請代碼:F03
- 負責人職稱:副教授
- 研究期限:2011-01-01 至 2011-12-31
- 支持經費:7(萬元)
項目摘要
韻律在語言表達中占有重要的地位。目前,計算機自動合成語音的自然度不夠理想,機器味較濃、節奏感較差,其主要缺陷就在於韻律方面。因此,研究韻律的恰當切分,正確把握話語的韻律結構,是提高計算機自動合成語音自然度的關鍵,也是實現人機對話和人工智慧的前提,具有重大的現實意義。在國內外的相關研究中,為了得到較大規模標註了韻律結構的文本語料開展工作,人們一般都採用手工標註的方法獲取。這不僅需要耗費大量的人力和時間,而且由於主要依靠主觀感覺,標註過程難以規範,標註過程和結果還容易受到標註者主觀知識的影響。針對上述問題,本課題探討一種無需韻律標註語料的漢語韻律結構自動切分方法。主要研究內容包括:利用中文文本中的標點符號信息獲取韻律結構信息;利用標點符號位置模擬韻律結構邊界;將線性排列的漢語句子表示為樹形結構;如何利用標點信息和樹形表示結構實現韻律結構的自動預測等。