基本介紹
- 中文名:合字
- 外文名:Ligature
- 別稱:連字、連結字或合體字
- 釋義:將多於一個字母的合成一個字形
- 拼音:he zi
歷史起源,拉丁文字,書法合字,起源字母,起源符號,二合字母,合字語言,非拉丁字元,電腦排版,
歷史起源
印刷合字單純源於手寫本中連寫的字元。以發現的最早的楔形文字手寫本中就已經含有很多連寫字元。中世紀的拉丁文手寫本中,謄寫僧人為加快速度將字元連寫,誕生了很多手寫縮合字,如在哥特體中,帶右圈的字母 (b, o, 和 p) 和帶左圈的字母 (c, e, o, d, g 和 q) 的圈部都被重疊書寫。很多手寫本字元如h, m和n的豎劃都被重疊,而且誕生了很多手寫縮合字。14世紀的手寫本中含有很多這種手寫縮合字。
當活字印刷誕生後,很多合字直接被製造成了鉛字。但是在1950年代無襯線字型廣泛使用,以及1970年代照相排版技術之後,合字就逐漸很少被使用。最早能進行合字電腦排版 (之後雷射印表機)之一的是 高德納的TeX 程式 (詳見下文)。這一潮流也影響到了1985年之後的桌面排版 技術。早期電腦軟體 ( TeX除外)無法進行合字替換,大部分新製作的電腦字型里也沒有合字。早期的個人電腦多使用英文,而英文中並不是必須使用合字,所以也沒有實際需要。
拉丁文字
書法合字
許多合字都把字母f和其後的字元組合起來,最常用的就是fi (或 fi,顯示為兩個獨立字元)。很多字型的這兩個字母並排在一起後,字母i上的點會抵擋到字母f的弧形勾,無法正確排印,所以乾脆就製造一個合字鉛字,把 i 的點融入 f 的勾來直接使用。其他 f 合字包括 fj, fl (fl), ff (ff), ffi (ffi), 和 ffl (ffl)。其他合字包括fa, fe, fo, fr, fs, ft, fb, fh, fu, fy,以及f 後加句號、 逗號或連字元,還有不太常用的雙寫ff和 fft 。
使用這些合字是因為通常的 小寫字母 f中弧形勾影響字元間距調整。
有時,跨詞合字 (如 shelfful的'ff')是不希望出現的,電腦程式 (如TeX)提供手動方式將它們分開。 一些字型帶有 fff合字 (如Requiem體甚至包括一個 fffl 合字)用於德語的複合詞,如 Sauerstoffflasche ("氧氣罐") 和 Schifffahrt ("遊艇") (僅在遵循1996年拼寫改革法的前提下才寫作 fff)。正式的德文正字法,如 Duden所述,不贊成跨詞合字,由於fff組合在德文中只會在組合詞出現如 (Schiff-fahrt, Sauerstoff-flasche),所以這樣跨詞合字在德文中使用會被認為是不正確的
土耳其語中有帶點和不帶點的字母I,如單詞 fırın ("烤箱") 和 fikir ("主意".。 fi合字容易混淆,所以在土耳其文排印中一般不使用該合字。像 fl合字一般也不用,土耳其語本來就沒有這樣的拼寫。
合字"ſʒ ("sz")和tʒ ("tz") 來自德語哥特體,現在街頭、城市廣場的標識中帶Platz或者以-platz結尾時仍常被使用。
有時 st (st) ſt (ſt), ch, ct以及Qu的合字也被使用(如字型Linux Libertine)。
起源字母
字母W是7世紀左右才被加入拉丁字母表的,其發音不盡相同。古英語使用盧恩字母Wynn (Ƿ) ,但受到諾曼人影響後廢棄不用。14世紀,這個起源於雙寫的V或U的"新"字母W誕生並在字母表中占有一席。由於它相對於其他字母比較年輕,只有很少歐洲語言(英語、荷蘭語、德語、波蘭語、威爾斯語、馬爾他語和瓦龍語)使用它來拼寫本土辭彙。
字元Æ(小寫æ,中世紀時稱為aesc)作為一個字元在丹麥語、挪威語、冰島語以及古英語中使用,並不是一個印刷用的合字。它是一個實在的字母——代表一個元音,且在字母表中有位置。現代英文正字法中Æ不作為一個單獨字母,而只是一種拼寫異形,如百科全書的英文單詞 "encyclopædia" 也可拼寫成 "encyclopaedia" 或"encyclopedia"。
Æ源自中世紀拉丁文,當時只是一些辭彙的隨意合字如 "Æneas"。它還可以在英文和法文中出現,但是現在已經傾向把 A和E分開印刷。 同樣,Œ 和œ在法文中雖然通常印刷成合字,但在技術限制情況下仍可以拆開書寫。
在德文正字法中,帶兩點的字母元音ä, ö和ü來自歷史上的ae, oe, ue 合字(嚴格的說是上標的e,即aͤ, oͤ, uͤ)。現在當文字處理無法顯示這三個字元的情況下仍可改寫為二合字母ae, oe, ue。字母排序中它們不等價於ae, oe, ue,而是被簡單看成 a, o, u。而北歐語言則不同:帶兩點的字母被視為獨立字母,並排在字母表最後。
一些元音中的圈形附加符號,如 å起源於一個o合字。現在把舊式 aa 改寫為 å 已經稱為不成文習慣,但在此之前也可寫成 a 上再加一個小 a (aͣ),如 Johannes Bureus, Runa ABC boken 。
uo 合字 ů 的使用實例也在早期現代高地德語里找到,但其後來混同到u中(如中期高地德語的fuosz、 早期現代高地德語 fuͦß、現代德語 Fuß)。它仍存在於捷克語中,被稱為kroužek。
西班牙語和葡萄牙語中的上波浪線,分別用於字母ñ和表示元音鼻音化,起源於一個nn合字(Espanna = España, anno = año)。同樣法語中的抑揚符也源自不發音s。 法語、葡萄牙語、西班牙語等中的字母ç其實是一個字母 "c" 蓋在一個"z"上面的形式。
字母hwair(ƕ)僅用於轉寫哥德語,代表hw合字。最早在1900年左右心理學者使用這個字用於代替二合字母 hv 用於表示有問題的現象,如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina,第18卷).
起源符號
最常用的合字元號當屬 &。它起源於E 和t的合字,即拉丁文的單詞“和”( "et")。它在法文中保持原音原意而在英文中也使用。由於其使用廣泛,一般已經不認為它是一個合字而是一個普通符號。
和其他合字一樣,它被仍當作一個字母來使用(如早期現代英語),英語中它念作"and"而不是"et",而&c念作 "et cetera"(等等)。大多數字型中的字形和兩字直接組合不一樣,但仍有一些字型 (如Trebuchet MS) 就把他們設計 & 為合字。
二合字母
二合字母,如西班牙語和威爾斯語中的 ll,一般不被看成是合字,因為印刷上兩個字母通常是分開的。正如上討論的合字一樣,一些二合字母在一些語言中有不同處理方式。西班牙1994年拼寫改革時,二合字母ch 和 ll 已經被考慮為分開的兩個字母。
法文的情況也一樣,œu被看成為合字 œ與字母 u的組合。
儘管如此,荷蘭語中 "ij"的定位比較模糊。根據不同的使用標準,它可看成是一個二合字母,或合字,或者一個獨立字母。它有獨立的大小寫形式,而在一些專業字型中,通常是有一個獨立字形也有合字 (如 Zapfino)。無襯線字型 大寫字母的IJ流行於荷蘭,通常形狀像是一個斷左臂的U。更令人混淆的是,手寫時可以把小寫字母y寫作沒有點的 ij,和大寫字母IJ (同樣沒有點)看起來只是大小差異而已。而 Y在本土荷蘭語辭彙中不被使用。
合字語言
丹麥語和挪威語
非拉丁字元
合字不僅出現在拉丁文本中:
婆羅米系文字的元音附標文字頻繁使用合字標註輔音。合字的數量依據語言而不同,如同樣的天城文,用於 梵文的合字就要比印地文多。總數為37的輔音中,在天城文兩個字母組成的合字總數為1369,很少字型能全部顯示這些合字。微軟[Windows]]系統附帶的''Mangal.ttf''字型帶有印地語支持,但不能正確處理在द, ट, ठ, ड, 和 ढ右邊的輔音合字, 而只是加 virama後按照一般形式顯示在輔音之後。 希臘字母中使用一些合字,特別是在 omicron (Ο) 和 upsilon (Υ)連寫 which later gave rise to one of the letters of the Cyrillic alphabet —參見Ou字母。 西里爾合字: Љ, Њ, Ы, Ѿ. Iotified 西里爾字母是早期西里爾illic decimal I和其他元音的合字: Ꙗ (Я的祖先), Ѥ, Ѩ, Ѭ, Ю (源自另外一個合字,Оу,早期的У形式)。馬其頓和塞爾維亞字母表中的兩個字母 lje 和 nje (љ, њ)在19世紀曾分別是El En (л, н) 與 軟音符 (ь)的合字。還有一個ya (Я)和 e 的合字:Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ. 格拉哥里字母的一些手寫形式:用於中世紀到19世紀書寫 Slavic 語言,多為方形且常用合字。 在希伯來語中字母aleph 和 lamed 在一些前現代文本中(主要是宗教或“猶太-阿拉伯”文本)可組合為合字。該組合很常用,因為 [ʔ][a]l- (在希伯來文中寫作 aleph加lamed)是阿拉伯語中的定冠詞。 阿拉伯文:各個字母在詞頭,詞中,詞尾均有不同形式。如阿拉伯文的mīm,單獨書寫為 م,三個連寫 (mmm,顯示為詞頭,詞中,詞尾形)就變為 ممم 。注意 lām + ʼalif 的情況是特殊的: ﻻ, 而 lām + ʼalif 詞中,詞尾形是ﻼ。在Unicode有一個特殊的安拉 合字位於U+FDF2: ﷲ. 烏爾都語 使用阿拉伯字母的手寫體 (Nasta`līq Script) ,在電子排印中有大量合字。烏爾都語最常用的排版工具 InPage使用 Nasta`līq Script字型多達 20,000個合字。
電腦排版
TeX是電腦排版系統中能使用合字的典型程式。 它能提供五個常用合字: ff、fi、fl、ffi 和 ffl。當TeX遇到這些組合時會自動替換成合字。當然操作者可以手動切換。
OpenType字型格式可以針對一個字元提供多個字形,因此用來作為合字替換,但需要軟體支持。XeTeX是一個TeX 排版引擎用來調用這些功能。這種替換原先主要用於阿拉伯文排版,但現在已經廣泛用於西文。
Unicode中對合字的處理不是一種字元定義,而是一種表現形式。比如,如果一個現代字型需要顯示'h'後加 'r',且該字型確實有'hr'合字,這個合字才會被顯示出來。因此,使用特殊Unicode合字字元是"不鼓勵"且"在任何環境下不會被再度編碼"。注意,合字 æ 和 œ 不能隨意替代 'ae' 和 'oe',比如 'does'不能寫作 'dœs'。
Unicode
這是一個不完整列表。U+A732到U+A73D 區域及其臨近區域的一些字元沒有列出。
非合字 | 合字 | Unicode |
---|---|---|
Et | U+0026 | |
ſs, ſz | ß | U+00DF |
AE, ae | Æ, æ | U+00C6, U+00E6 |
OE, oe | Œ, œ | U+0152, U+0153 |
IJ, ij | IJ, ij | U+0132, U+0133 |
ue | ᵫ | U+1D6B |
ff | ff | U+FB00 |
fi | fi | U+FB01 |
fl | fl | U+FB02 |
ffi | ffi | U+FB03 |
ffl | ffl | U+FB04 |
ſt | ſt | U+FB05 |
st | st | U+FB06 |
另外,Dz、 克羅地亞語和波士尼亞語字母 DŽ, LJ, 和 NJ都有單獨的碼位。它們不是合字而是二合字母。 僅在語音轉寫中使用的合字
Non-ligature | Ligature | Unicode |
---|---|---|
db | ȸ | U+0238 |
qp (cp) | ȹ | U+0239 |
dz | ʣ | U+02A3 |
dʑ (or dz curl) | ʥ | U+02A5 |
dʒ (or dezh) | ʤ | U+02A4 |
fŋ | ʩ | U+02A9 |
ls | ʪ | U+02AA |
lz | ʫ | U+02AB |
lʒ (or lezh) | ɮ | U+026E |
tɕ (or tc curl) | ʨ | U+02A8 |
ts | ʦ | U+02A6 |
tʃ (or tesh) | ʧ | U+02A7 |
U+0238 和 U+0239 是二合字母,但實際上是合字。