介紹,漢語部分,
介紹
中國語言資源有聲資料庫是國家語言資源建設工程之一,它用現代信息技術採錄語言數據,經轉寫、標記等加工程式將相關的文本檔案、音頻檔案及視頻檔案整理入庫,以資料庫、網際網路、博物館、語言實驗室等形式向學界和社會提供服務。
漢語部分
根據《中國語言資源有聲資料庫調查手冊》,中國語言資源有聲資料庫(漢語)部分設計為:
一、語言和方言調查
1.調查點:根據縣級行政單位設定調查點,原則上“一縣一點”,特殊情況下可以增點或減點。本調查重在反映當下語言的實態,因此調查點選擇縣城等在當地影響較大的地方。
2.調查對象:每個調查點根據性別因素和年齡因素選擇有代表性的4名發音合作人,其中男女各2人,老年青年各2人。
3.調查內容:調查內容分語言結構調查和話語調查兩大部分。
語言結構調查是基礎,用1000字調查語音系統,用1200詞調查基本辭彙系統,用50個句子調查主要的語法現象。
話語調查是重點,分為講述和對話兩部分。講述包括“規定故事”和“自選話題”。規定故事為《牛郎和織女》
4.調查方法:採用規定的錄音設備、軟體進行錄音,輔之以錄像和照片。並且,對調查內容還要按照一定要求進行必要的國際音標轉寫和漢字轉寫。最後,對一個調查點的所有調查資料和電子檔案進行命名、分類、歸檔。
5.建庫:國家組織專人進行驗收,將調查材料統一建檔入庫。並及時組織專家對資料庫進行開發。
二、“地方國語”調查
地方國語調查與語言和方言調查一同進行。其選點要求也與語言和方言的調查相同,原則上是一縣一點。每調查點選擇3名發音合作人,這3名發音合作人的國語水平處在不同的等級:1名相當於《國語水平測試等級標準》 規定的三級甲等,1名僅次於三級乙等,1名國語水平最差,接近方言。
地方國語的調查內容是:1、用國語講述規定故事《牛郎和織女》;2、用國語朗讀兩篇短文《誠實與信任》《大學生村官》。調查得到的音頻檔案等經整理驗收,建檔入庫,形成地方國語語料庫。
地方國語語料庫是中國語言資源有聲資料庫的一個分庫。