中國哲學書電子化計畫

中國哲學書電子化計畫

中國哲學書電子化計畫(英文名Chinese Text Project)是一個線上古籍文獻檢索系統,是線上古典文獻最豐富且最可靠的來源之一。它的目的是提供儘可能精確且便利使用的中國古代原典文獻,尤其先秦兩漢文獻,把這些資料以恰當結構、可搜尋模式來展現,並且廣泛使用現代技術作為工具使這些文獻更容易學習和研究。

基本介紹

  • 中文名:中國哲學書電子化計畫
  • 外文名:Chinese Text Project
  • 統一碼聯盟:Unicode Consortium
  • 後設資料:元資料
簡介,主要內容和功能,原典資料庫,內部字典,詞語分析表,相似段落資料,原典影印本,引得、索引訊息,後設資料系統,原典來源,

簡介

它的主要內容包括原典資料庫、當代研究資料庫以及內部字典;原典資料庫的內容包括:儒家墨家道家法家名家兵家算書雜家史書、經典文獻、字書醫學以及出土文獻先秦兩漢各種原文資料。部分原典有現代漢語和英文的翻譯本,另外還有內部字典、底本掃描版、相似段落提示等獨特的功能。

主要內容和功能

原典資料庫

網站最主要的部分為古籍資料庫,此資料庫包含各種從哲學、歷史、語言學等角度被視為重要的文獻,寫作年代以先秦兩漢為主。本網站的所有資料都存在一個專門設計的資料庫,以便讀瀏覽和搜尋的方便。此外,部分原典有附英文或現代漢語翻譯,這些翻譯是一段一段對照原典而附上的,因此很容易從譯文找出對應的原典,或從原典找出對應的譯文。

內部字典

內部漢字字典合併三個來源的信息:統一碼聯盟(Unicode Consortium)的「Unihan」資料庫、上述的原典資料庫、以及本網站新開發的CTP字典。其中Unihan資料庫提供有關漢字的基本信息,包括部首、筆畫數、異體字、標準字典中的出處、以及英文翻譯(但此英文翻譯以現代漢語用法為主)。原典資料庫則給每一個字提供原典中的具體出處。最後,CTP字典試圖對漢字的語義和實際運用提供一個儘可能完整的分析。雖然從漢字的數量上看大多數漢字是單義詞,但少數很常用的字卻有許多不同的用法,這些不同用法通常有不同語義或讀法。 CTP字典把這些不同意義或不同讀法的用法分開處理,並且通過原典資料庫給每一個不同用法分別提供原典出處。這一功能是透過一種「語義連結」的手段而實現的,即建立從某篇某段某句中的某字到CTP字典中的相關用法的連結。建立這些連結需要對文本的理解,因而是一個手動的且耗時的程式;因此CTP字典的範圍目前很有限(但日益增加)。

詞語分析表

通過內部字典和上述的語義連結,還可以對原典資料庫中的任何段落提供詞語分析表。詞語分析表為段落中的每一個字顯示字典中的英文翻譯及其它信息,並且對於有語意連結的詞語顯示詞語在此脈絡中的意義。例如,在《論語》的第一段中,系統會顯示「樂」的正確讀法是「le」而不是「yue」,且該句中「說」的用法跟「悅」的讀法、意義相同。
建立語意連結的計畫正在進行,因此目前也有缺少連結的字。當一個字尚未有語意連結時,系統將會顯示此字的基本資料,並提供至完整字典項目的連線。

相似段落資料

由於種種原因,許多早期文獻含有與其它文獻相似的片段或較長的段落,足以證明兩個著作並非完全獨立而形成的。此現象有時表明原作者有意識的抄寫了當時已形成的其它著作;有時表明謀一個俗語當時已流行;也有時是由其它的原因造成的。在許多情況下,雖然這些相似的片段具有明顯的相似性,並足以保證此相似性並非巧合,與此同時這些片段有時候具有重要且有趣的不同之處。
相似段落功能把這些相似或相同的段落連線起來,且顯示相似部份以便對照。任何具有相似段落訊息的段落將會顯示圖示;點擊此圖示將會顯示此段落、所有相似段落及其連線。

原典影印本

許多早期文獻具有不同的現存版本。這些版本的不同有些是因不同的文獻歷史背景而產生的,也有一些產生於糾正抄寫錯誤,也有部份來自假借字現象而造成的,而另外還有更多造成原因。這些造成原因加起來使得我們很難看出今天的電子版或印刷版的原典是否「正確」;甚至使得我們很難以下定義說什麼叫做「正確」的版本,畢竟未必真的曾經存在過所謂「最原始的」由一個作者所寫作的版本。
中國哲學書電子化計畫《毛詩正義·關雎》中國哲學書電子化計畫《毛詩正義·關雎》
因此,本站為越來越多的原典提供原典掃瞄版,且為原典每一段落提供至掃瞄版的連線。原典資料庫中的每一個字應對應於掃瞄版的一個字,而系統能夠給使用者顯示原典及原典掃瞄版的對照本,以便使用者確定原典與掃瞄本無誤。另,因為掃瞄本有可能經過後世的研究而被視為本身有誤,因此系統將會註明所有被修改的字詞,同時保留原本錯誤的字以便與掃瞄版對照。

引得、索引訊息

在文獻(尤其是英文文獻)中提到原典資料時,學者經常使用此段落在標準的引得或索引中的編號來指稱它,例如,使用哈佛燕京學社引得系列,或逐字索引叢刊系列,在文獻中標註索引或引得中的第幾頁、第幾篇、第幾行的原典是他所探討的對象,例如,「《莊子引得》4/2/35」,即在《莊子引得》中的第4頁第2篇第35行中所出現的文字,就這一例子而言,是指「故為是舉莛與楹,厲與西施,恢恑憰怪,道通為一。其分也,成也;其成也,毀也。凡物」。但如果學者的文獻中尚未引用原典文字或其翻譯(在某些英文期刊及其它出版物中,經常是如此),則讀者很難以確認作者所指的是原典中哪一個段落,除非讀者手中也有同一本索引或引得。
為了試圖解決這個問題,本站對部份原典提供索引、引得查詢服務,透過輸入索引、引得編號,可檢索到其所對應的原典段落。例如,就上述的例子,讀者輸入了編號「4/2/35」之後,馬上就可以找出所對應的原文。若想要使用這一功能,請先打開原典的目錄頁,然後在目錄右邊的「引得、索引查詢」輸入方塊中輸入編號,或者使用引得、索引訊息頁面中的輸入方塊輸入。另外,您可以查詢支持這一功能的原典文獻的任何一個段落的索引、引得編號。只要點擊段落左邊的圖示,然後把滑鼠移到原典上,就可以看出相關的索引、引得訊息。

後設資料系統

許多功能都依賴於謀種「後設資料」(又稱「元資料」),即有關資料的資料;就本站而言,「後設資料」是指有關原典文獻的資料。後設資料系統的目的是讓使用者能夠為資料庫中的原典增加新的後設資料,因而使得資料庫能夠實現上述功能所無法實現的目的。後設資料可以是個人專用的,也可以是公開給所有人分享。
本站的每件後設資料包括:一個屬性,例如「成語來源」或「我認為有趣的原文」,以及原典文獻中具有此屬性的段落或片段;另外也可以有其它相關的資料,例如,一句話說明為什麼此片段具有此屬性。後設資料成立之後,可以使用下述的「高級搜尋」功能搜尋。

原典來源

原典和翻譯本的版本信息被注在每一本書的目錄頁的最下面,另外也可以通過左邊全站目錄中書名旁邊的圖案來查詢。沒有顯示此圖案的書尚未與印刷本對照。如果您想要在學術論文中引用原典或某一作者的英文翻譯,建議您務必事先查印刷本確認詳細內容。本網站提供方便查詢的原典與翻譯,但要注意的是尤其在翻譯上本站的目的不在於提供與某一翻譯本一模一樣的內容,然而在某些地方這些翻譯已經經過修改了。此外,若您想要在學術論文中引用英文翻譯,使用當代的英文翻譯可能會更合適。為了尊重當代翻譯者的著作權,本網站使用的大部分翻譯是著作權已失效的英文翻譯本。若您對當代英文翻譯本及其它參考書目有興趣,您可以參考本站的「相關資料」區。

相關詞條

熱門詞條

聯絡我們