《古籍漢字字頻統計》的編寫源於五年前書同文公司向國家語委申請的古籍漢字信息處理攻關研究成果。該成果以ISO/IEC 10646 CJK標準與《康熙字典》字頭建立一一對應作為字頻統計的基礎綱目,以《文淵閣四庫全書》和《四部叢刊》全文數碼數據作為統計對象(超過八億古籍漢字語料),最終得出每個漢字的字頻排序、出現次數、出現頻率,同時也揭示了中文古籍漢字用字量、用字臨界點等奧秘,使過去一直模糊不清的技術和套用參數得到明確的驗證。 該書的成書發行將為海內外古籍出版業者、中文數位化工程、中文信息處理工作者提供強有力的幫助以及權威性的理論和實用性依據。
基本介紹
- 書名:古籍漢字字頻統計
- 作者:張軸才 張軸材
- 出版社:商務出版社
- 出版時間:2008年7月1日
- 頁數:416 頁
- 開本:16 開
- ISBN:9787100056076
- 語種:簡體中文
內容簡介,圖書目錄,
內容簡介
本書的編寫源於五年前書同文公司向國家語委申請的古籍漢字信息處理攻關研究成果。該成果以ISO/IEC 10646 CJK標準與《康熙字典》字頭建立一一對茅市應作為字頻統計的基礎綱目,以《她幾巴文淵閣四庫全書》和《四部嬸立盛付蘭凳擔叢刊》全文數碼數據作為統計對象(超過八億古籍漢字語料),最終得出每個漢字的字頻排序、出現次數、出現頻率,同時也揭示了中文古籍漢字用字量、用字臨界點等奧秘,使過去一直模糊不清的微元譽擊技術和套用參數得到巴拘陵明確的驗證。
該書的成書發行將為海內外古籍出版業者、中文數位化工程、中文信息處理工作者提供強有力的幫助以及權威性的理論和實用性依據。
圖書目錄
1.前言
2.凡例
3.大規模古籍漢字用字統計報告
4.古籍字頻統計表
5.古籍字頻統計表索引
6.附錄A:《四庫全書》電子版工程“保真原則”說明
7.附錄B
(1)樣張說明
(2)ISO/IEC 10646:2003 CJK漢字與《祖汽嚷康熙字典》關聯表說明
(3)ISO/IEC 10646:2003 CJK漢字與《康熙字典》關聯表頁碼·字位序說明
(4)ISO/IEc 10646:2003 CJK漢字與《康熙字典》關聯表重複字表說明