合字

合字

合字、連字、連結字或合體字,中文裡指多個獨體字組成的字,如:“昌”、“想”等,在西方字型排印學中一般表示將多於一個字母的合成一個字形。

如印刷品中常常將拉丁字母兩個字母fi的i上一點常與f的一橫合併,而德語字母“β”原為ss等等。 合字經過演變、長時間流行後,可能被視為直接符號、文字而非合字。如W源自VV或UU,Æ源自AE,而表示“與”的意思的“&”,原是e和t的合字。

另外,漢字中如孔孟好學招財進寶日進斗金一般稱為合文。

基本介紹

  • 中文名合字
  • 外文名:Ligature
  • 別稱:連字、連結字或合體字
  • 釋義:將多於一個字母的合成一個字形
  • 拼音:he zi
歷史起源,拉丁文字,書法合字,起源字母,起源符號,二合字母,合字語言,非拉丁字元,電腦排版,

歷史起源

印刷合字單純源於手寫本中連寫的字元。以發現的最早的楔形文字手寫本中就已經含有很多連寫字元。中世紀的拉丁文手寫本中,謄寫僧人為加快速度將字元連寫,誕生了很多手寫縮合字,如在哥特體中,帶右圈的字母 (b, o, 和 p) 和帶左圈的字母 (c, e, o, d, gq) 的圈部都被重疊書寫。很多手寫本字元如h, mn的豎劃都被重疊,而且誕生了很多手寫縮合字。14世紀的手寫本中含有很多這種手寫縮合字。
“招財進寶”的合書“招財進寶”的合書
活字印刷誕生後,很多合字直接被製造成了鉛字。但是在1950年代無襯線字型廣泛使用,以及1970年代照相排版技術之後,合字就逐漸很少被使用。最早能進行合字電腦排版 (之後雷射印表機)之一的是 高德納TeX 程式 (詳見下文)。這一潮流也影響到了1985年之後的桌面排版 技術。早期電腦軟體 ( TeX除外)無法進行合字替換,大部分新製作的電腦字型里也沒有合字。早期的個人電腦多使用英文,而英文中並不是必須使用合字,所以也沒有實際需要。
隨著現代電腦處理的多語言化和現代電子排版技術(如 OpenType),合字開始逐漸恢復被使用。

拉丁文字

書法合字

許多合字都把字母f和其後的字元組合起來,最常用的就是 (或 fi,顯示為兩個獨立字元)。很多字型的這兩個字母並排在一起後,字母i上的點會抵擋到字母f的弧形勾,無法正確排印,所以乾脆就製造一個合字鉛字,把 i 的點融入 f 的勾來直接使用。其他 f 合字包括 fj, fl (fl), ff (ff), ffi (ffi), 和 ffl (ffl)。其他合字包括fa, fe, fo, fr, fs, ft, fb, fh, fu, fy,以及f 後加句號逗號連字元,還有不太常用的雙寫fffft
標識得最後一個字是 'tʒ'合字。標識得最後一個字是 'tʒ'合字。
使用這些合字是因為通常的 小寫字母 f中弧形勾影響字元間距調整。
有時,跨詞合字 (如 shelfful的'ff')是不希望出現的,電腦程式 (如TeX)提供手動方式將它們分開。 一些字型帶有 fff合字 (如Requiem體甚至包括一個 fffl 合字)用於德語的複合詞,如 Sauerstoffflasche ("氧氣罐") 和 Schifffahrt ("遊艇") (僅在遵循1996年拼寫改革法的前提下才寫作 fff)。正式的德文正字法,如 Duden所述,不贊成跨詞合字,由於fff組合在德文中只會在組合詞出現如 (Schiff-fahrt, Sauerstoff-flasche),所以這樣跨詞合字在德文中使用會被認為是不正確的
土耳其語中有帶點和不帶點的字母I,如單詞 fırın ("烤箱") 和 fikir ("主意".。 fi合字容易混淆,所以在土耳其文排印中一般不使用該合字。像 fl合字一般也不用,土耳其語本來就沒有這樣的拼寫。
合字"ſʒ ("sz")和 ("tz") 來自德語哥特體,現在街頭、城市廣場的標識中帶Platz或者以-platz結尾時仍常被使用。
有時 st (st) ſt (ſt), ch, ct以及Qu的合字也被使用(如字型Linux Libertine)。

起源字母

字母W是7世紀左右才被加入拉丁字母表的,其發音不盡相同。古英語使用盧恩字母Wynn (Ƿ) ,但受到諾曼人影響後廢棄不用。14世紀,這個起源於雙寫的VU的"新"字母W誕生並在字母表中占有一席。由於它相對於其他字母比較年輕,只有很少歐洲語言(英語、荷蘭語、德語、波蘭語、威爾斯語、馬爾他語和瓦龍語)使用它來拼寫本土辭彙。
合字
字元Æ(小寫æ,中世紀時稱為aesc)作為一個字元在丹麥語挪威語冰島語以及古英語中使用,並不是一個印刷用的合字。它是一個實在的字母——代表一個元音,且在字母表中有位置。現代英文正字法中Æ不作為一個單獨字母,而只是一種拼寫異形,如百科全書的英文單詞 "encyclopædia" 也可拼寫成 "encyclopaedia" 或"encyclopedia"。
Æ源自中世紀拉丁文,當時只是一些辭彙的隨意合字如 "Æneas"。它還可以在英文和法文中出現,但是現在已經傾向把 AE分開印刷。 同樣,Œœ在法文中雖然通常印刷成合字,但在技術限制情況下仍可以拆開書寫。
在德文正字法中,帶兩點的字母元音ä, ö和ü來自歷史上的ae, oe, ue 合字(嚴格的說是上標的e,即aͤ, oͤ, uͤ)。現在當文字處理無法顯示這三個字元的情況下仍可改寫為二合字母ae, oe, ue。字母排序中它們不等價於ae, oe, ue,而是被簡單看成 a, o, u。而北歐語言則不同:帶兩點的字母被視為獨立字母,並排在字母表最後。
一些元音中的圈形附加符號,如 å起源於一個o合字。現在把舊式 aa 改寫為 å 已經稱為不成文習慣,但在此之前也可寫成 a 上再加一個小 a (aͣ),如 Johannes Bureus, Runa ABC boken 。
uo 合字 ů 的使用實例也在早期現代高地德語里找到,但其後來混同到u中(如中期高地德語fuosz、 早期現代高地德語 fuͦß、現代德語 Fuß)。它仍存在於捷克語中,被稱為kroužek
西班牙語葡萄牙語中的上波浪線,分別用於字母ñ和表示元音鼻音化,起源於一個nn合字(Espanna = España, anno = año)。同樣法語中的抑揚符也源自不發音s。 法語、葡萄牙語、西班牙語等中的字母ç其實是一個字母 "c" 蓋在一個"z"上面的形式。
字母hwair(ƕ)僅用於轉寫哥德語,代表hw合字。最早在1900年左右心理學者使用這個字用於代替二合字母 hv 用於表示有問題的現象,如Jacques Paul Migne在其1860年代的著作 (Patrologia Latina,第18卷).
拜占庭帝國有一個獨特的合字o-u ligature (Ȣ) ,它源於希臘字母的 ο-υ 兩個字母的合字,並被加入到了字母表中。
Gha (ƣ)是一個罕見的字母,起源於 Q 和 G,但在ISO的檔案中誤注成 O-I 合字 (參見Unicode註解)
國際音標使用合字來表示塞擦音,其中6個有Unicode編碼: ʣ, ʤ, ʥ, ʦ, ʧ and ʨ。一個擦音仍使用合字:ɮ,而國際音標擴展里加入了後三個:ʩ , ʪ and ʫ.

起源符號

最常用的合字元號當屬 &。它起源於Et的合字,即拉丁文的單詞“和”( "et")。它在法文中保持原音原意而在英文中也使用。由於其使用廣泛,一般已經不認為它是一個合字而是一個普通符號。
和其他合字一樣,它被仍當作一個字母來使用(如早期現代英語),英語中它念作"and"而不是"et",而&c念作 "et cetera"(等等)。大多數字型中的字形和兩字直接組合不一樣,但仍有一些字型 (如Trebuchet MS) 就把他們設計 & 為合字。
同樣,美元符號 $可能也起源於合字 ( "pesos",但有也有其他不同說法),但現在實際上已經被當成一個普通符號。 西班牙比塞塔(peseta)也有時被寫作合字 ₧ (源自 Pts).

二合字母

二合字母,如西班牙語威爾斯語中的 ll,一般不被看成是合字,因為印刷上兩個字母通常是分開的。正如上討論的合字一樣,一些二合字母在一些語言中有不同處理方式。西班牙1994年拼寫改革時,二合字母chll 已經被考慮為分開的兩個字母。
法文的情況也一樣,œu被看成為合字 œ與字母 u的組合。
儘管如此,荷蘭語中 "ij"的定位比較模糊。根據不同的使用標準,它可看成是一個二合字母,或合字,或者一個獨立字母。它有獨立的大小寫形式,而在一些專業字型中,通常是有一個獨立字形也有合字 (如 Zapfino)。無襯線字型 大寫字母的IJ流行於荷蘭,通常形狀像是一個斷左臂的U。更令人混淆的是,手寫時可以把小寫字母y寫作沒有點的 ij,和大寫字母IJ (同樣沒有點)看起來只是大小差異而已。而 Y在本土荷蘭語辭彙中不被使用。

合字語言

丹麥語和挪威語

非拉丁字元

合字不僅出現在拉丁文本中:
婆羅米系文字的元音附標文字頻繁使用合字標註輔音。合字的數量依據語言而不同,如同樣的天城文,用於 梵文的合字就要比印地文多。總數為37的輔音中,在天城文兩個字母組成的合字總數為1369,很少字型能全部顯示這些合字。微軟[Windows]]系統附帶的''Mangal.ttf''字型帶有印地語支持,但不能正確處理在द, ट, ठ, ड, 和 ढ右邊的輔音合字, 而只是加 virama後按照一般形式顯示在輔音之後。 希臘字母中使用一些合字,特別是在 omicron (Ο) 和 upsilon (Υ)連寫 which later gave rise to one of the letters of the Cyrillic alphabet —參見Ou字母。 西里爾合字: Љ, Њ, Ы, Ѿ. Iotified 西里爾字母是早期西里爾illic decimal I和其他元音的合字: Ꙗ (Я的祖先), Ѥ, Ѩ, Ѭ, Ю (源自另外一個合字,Оу,早期的У形式)。馬其頓和塞爾維亞字母表中的兩個字母 lje 和 nje (љ, њ)在19世紀曾分別是El En (л, н) 與 軟音符 (ь)的合字。還有一個ya (Я)和 e 的合字:Ԙԙ,其他合字包括 Ꚅꚅ 和 Ꚉꚉ. 格拉哥里字母的一些手寫形式:用於中世紀到19世紀書寫 Slavic 語言,多為方形且常用合字。 在希伯來語中字母aleph 和 lamed 在一些前現代文本中(主要是宗教或“猶太-阿拉伯”文本)可組合為合字。該組合很常用,因為 [ʔ][a]l- (在希伯來文中寫作 aleph加lamed)是阿拉伯語中的定冠詞阿拉伯文:各個字母在詞頭,詞中,詞尾均有不同形式。如阿拉伯文的mīm,單獨書寫為 م‎,三個連寫 (mmm,顯示為詞頭,詞中,詞尾形)就變為 ممم ‎。注意 lām + ʼalif 的情況是特殊的: ﻻ‎, 而 lām + ʼalif 詞中,詞尾形是ﻼ‎。在Unicode有一個特殊的安拉 合字位於U+FDF2: ﷲ‎. 烏爾都語 使用阿拉伯字母的手寫體 (Nasta`līq Script) ,在電子排印中有大量合字。烏爾都語最常用的排版工具 InPage使用 Nasta`līq Script字型多達 20,000個合字。

電腦排版

TeX是電腦排版系統中能使用合字的典型程式。 它能提供五個常用合字: fffiflffiffl。當TeX遇到這些組合時會自動替換成合字。當然操作者可以手動切換。
OpenType字型格式可以針對一個字元提供多個字形,因此用來作為合字替換,但需要軟體支持。XeTeX是一個TeX 排版引擎用來調用這些功能。這種替換原先主要用於阿拉伯文排版,但現在已經廣泛用於西文。
下表列出了常用文字對的合字以及Unicode代碼。正確顯示需要使用能正確處理合字的作業系統瀏覽器 並調用正確的Unicode 電腦字型。
Unicode中對合字的處理不是一種字元定義,而是一種表現形式。比如,如果一個現代字型需要顯示'h'後加 'r',且該字型確實有'hr'合字,這個合字才會被顯示出來。因此,使用特殊Unicode合字字元是"不鼓勵"且"在任何環境下不會被再度編碼"。注意,合字 æ 和 œ 不能隨意替代 'ae' 和 'oe',比如 'does'不能寫作 'dœs'。
Unicode
這是一個不完整列表。U+A732到U+A73D 區域及其臨近區域的一些字元沒有列出。
非合字
合字
Unicode
Et
U+0026
ſs, ſz
ß
U+00DF
AE, ae
Æ, æ
U+00C6, U+00E6
OE, oe
Œ, œ
U+0152, U+0153
IJ, ij
IJ, ij
U+0132, U+0133
ue

U+1D6B
ff

U+FB00
fi

U+FB01
fl

U+FB02
ffi

U+FB03
ffl

U+FB04
ſt

U+FB05
st

U+FB06
另外,Dz、 克羅地亞語和波士尼亞語字母 DŽ, LJ, 和 NJ都有單獨的碼位。它們不是合字而是二合字母。 僅在語音轉寫中使用的合字
Non-ligature
Ligature
Unicode
db
ȸ
U+0238
qp (cp)
ȹ
U+0239
dz
ʣ
U+02A3
dʑ (or dz curl)
ʥ
U+02A5
dʒ (or dezh)
ʤ
U+02A4

ʩ
U+02A9
ls
ʪ
U+02AA
lz
ʫ
U+02AB
lʒ (or lezh)
ɮ
U+026E
tɕ (or tc curl)
ʨ
U+02A8
ts
ʦ
U+02A6
tʃ (or tesh)
ʧ
U+02A7
U+0238 和 U+0239 是二合字母,但實際上是合字。

相關詞條

熱門詞條

聯絡我們