文字書寫系統的計算理論

文字書寫系統的計算理論

《文字書寫系統的計算理論》以說明文語轉換系統的可操作性問題為前提,目的並不是要介紹不同的文字書寫系統。最重要的理論論點都在第一章提出。其兩個基本論點是:(一)詞形到書寫規則的映射存在正則關係(regular relation);(二)一個特定語言的書寫系統所表達的語言學信息具有一致性(consistency)。其它的章節主要是通過實例以不同的角度來對這兩個論點作出詳細的闡述和證明。第二章較詳細的闡述了書寫系統的正則性。第三章則詳細說明了特定文字如何表達語言學信息以及所信息表達信息的一致性問題。第四章介紹現代語言學的幾種常用的文字型系分類,進而提出對文字書寫系統的二維分類方法。第五章簡要介紹如何用心理語言學的方法來分析母語讀者進行文語轉換的方式,並將《文字書寫系統的計算理論》所提出的理論與心理語言學的結論進行印證。第六章先講解文字與書寫系統是如何被不同的文字借鑑以及承傳的方式方法,另外給出文字中對縮寫和數字的表述以及轉換,最後對《文字書寫系統的計算理論》的內容做了一個總結。

基本介紹

  • 書名:文字書寫系統的計算理論
  • 作者:史伯樂(Richard Sproat) 陸勤
  • 出版日期:2010年8月1日
  • 語種:英語
  • ISBN:9787301171554, 7301171552
  • 外文名:A Computational Theory of Writing Systems
  • 出版社:北京大學出版社
  • 頁數:236頁
  • 開本:16
  • 品牌:北京大學出版社
基本介紹,內容簡介,作者簡介,圖書目錄,序言,

基本介紹

內容簡介

《文字書寫系統的計算理論》:計算語言學與語言科技原文叢書

作者簡介

作者:(美) 史伯樂 (Sproat.R.) .

圖書目錄

導讀
Preface
List of Figures
List of Tables
Reading Devices
1.1 Text-to-Speech Conversion. A Brief Introduction
1.2 The Task of Pronouncing Aloud. A Model
1.2.1 A Simple Example from Russian
1.2.2 Formal Definitions
1.2.2.1 AVMs and Annotation Graphs
1.2.2.2 Definitions
1.2.2.3 Axioms
1.2.3 Central Claims of the Theory
1.2.3.1 Regularity
1.2.3.2 Consistency
1.2.4 Further Issues
1.2.4.1 Why a Constrained Theory of Writing Systems?
1.2.4.2 Orthography and the "Segmental"
Assumption
1.3 Terminology and Conventions
1.A Appendix. An Overview of Finite-State Automata
and Transducers
1. A. 1 Regular Languages and Finite-State Automata
1. A. 2 Regular Relations and Finite-State Transducer,
2 Regularity
2.1 Planar Regular Languages and Planar Regular Relations
2.2 The Locality Hypothesis
2.3 Planar Arrangements. Examples
2.3.1 Korean Hankul
2.3.2 Devanagari
2.3.3 Pahawh Hmong
2.3.4 Chinese
2.3.5 A Counterexample from Ancient Egyptian
2.4 Cross-Writing-System Variation in the SLU
2.5 Macroscopic Catenation.. Text Direction
2. A Sample Chinese Characters and Their Analyses
3 ORL Depth and Consistency
3.1 Russian and Belarusian Orthography: A Case Study
3.1.1 Vowel Reduction
3.1.2 Regressive Palatalization
3.1.3 Lexical Marking in Russian and Other Issue
3.1.4 Summary of Russian and Belarusian
3.2 English
3.3 The Orthographic Representation of Serbo-Croatian Consonant Devoicing
3.3.1 Methods and Materials
3.3.2 Results
3.4 Cyclicity in Orthography
3.5 Surface Orthographic Constraints
3. A English Deep and Shallow ORLs
3. A. 1Lexical Representations
3. A. 2 Rules for the Deep ORL
3. A. 3 Rules for the Shallow ORL
4 Linguistic Elements
4.1 Taxonomies of Writing Systems:A Brid Overview
4.1.1 Gelb
4.1.2 Sampson
4.1.3 DeFraneis
4.1.3.1 No Full Writing System Is Semasiographic
4.1.3.2 All Full Writing Is Phonographic
4.1.3.3 Hanku[ Is Not Featural
4.1.4 A New Proposal
4.1, 5 Summary
4.2 Chinese Writing
4.3 Japanese Writing
4.4 Some Further Examples
4.4.1 Syriac Syame
4.4.2 Reduplication Markers
4.4.3 Cancellation Signs
5 Psycholinguistie Evidence
5.1 Multiple Routes and the Orthographic
Depth Hypothesis
5.1.1 Evidence for the Orthographic Depth Hypothesis
5.1.2 Evidence against the Orthographic
Depth Hypothesis
5.2 "Shallow" Processing in "Deep" Orthographies
5.2.1 Phonological Access in Chinese
5.2.2 Phonological Access in Japanese
5.2.3 Evidence for the Function of Phonetic Components in Chinese
5.2.4 Summary
5.3 Connectionist Models:The Seidenberg-McClelland Model
5.3.1 Outline of the Model
5.3.2 What Is Wrong with the Model?
5.4 Summary
6Further Issues
6.1 Adaptation of Writing Systems:The Case of Manx Gaelic
6.2 Orthographic Reforms. The Case of Dutch
6.2.1 The 1954 Spelling Rules
6.2.2 The 1995 Spelling Rules
6.3 Other Forms of Notation: Numerical Notation and It,
Relation to Number Names
6.4 Abbreviatory Devices
6.5 Non-Bloomfieldian Views on Writing
6.6 Postscript
Bibliography
Index

序言

計算語言學(Computational Linguistits,CL)在語言科學與信息科學的研究領域扮演關鍵性的角色。語言學理論尋求對語言現象規律性的揭示與完整的解釋。計算語言學正好提供了驗證與套用這些規律與解釋的大好機會。作為語言學、信息科學乃至於心理學與認知科學結合的交叉學科,計算語言學更提供了語言學基礎研究與套用研究的絕佳界面。事實上,計算語言學與人類語言科技(Human Language Technology,HLT)可以視為一體兩面,不可分割。
計算語言學研究濫觴於上世紀五六十年代的機器翻譯研究。中文的相關研究也幾乎同步開始,1960年起在柏克萊加州大學研究室,王士元、鄒嘉彥、C.Y. Dougherty等人已開始研究中英、中俄機器翻譯。他們的中文計算語言學研究,可說是與世界最尖端科技同步的。中國國內中俄翻譯研究也不遑多讓,大約在上世紀50年代中期便已開始。可惜的是,這些中文相關早期機器翻譯研究,由於硬體與軟體的限制,沒能延續下來。中文計算語言學研究比較有系統的進展,還要等到1986年;海峽兩岸在同一年成立了兩個致力於中文計算語言學基礎架構建立的研究群。北京大學的計算語言學研究所在朱德熙先生倡導下成立,隨後一段時間由陸儉明、俞士汶主持。而台灣“中研院”的中文詞知識庫小組,由謝清俊創立,陳克健主持,黃居仁1987年返台後加入。
  

相關詞條

熱門詞條

聯絡我們