古騰堡工程

古騰堡工程

古騰堡工程(Project Gutenberg,常簡寫作PG)由志願者參與,致力於文本著作的電子化、歸檔以及發布。古騰堡工程標誌該工程肇始於1971年,是最早的數字圖書館。其中的大部分書籍都是公有領域書籍的原本,古騰堡工程確保這些原本自由流通、格式開放,有利於長期保存,並可在各種計算機上閱讀。

基本介紹

  • 中文名:古騰堡工程
  • 外文名:Project Gutenberg
  • 屬性:由志願者參與
  • 性質:致力於文本著作的電子化
歷史,收錄範圍,理想,著作權問題,批評,姐妹項目,

歷史

古騰堡工程由Michael Hart於1971年啟動。當時Hart是伊利諾伊大學的學生,他獲得了學校材料研究實驗室中Xerox Sigma V大型計算機的使用許可權。通過和善的操作員,他得到一個幾乎沒有時限的帳號,後來估算這價值約100,000乃至1000,000,000美元不等。Hart想通過做一些有價值的事情,作為這份饋贈"物有所值"。
後來這台計算機碰巧成為組成網際網路的計算機網路15個節點之一。Hart認為有朝一日公眾都可以接觸計算機,因而他決定將書籍電子化,供人們自由使用。剛好他背包里有一份美國獨立宣言,該宣言也就成了古騰堡工程的的第一份電子文本。
該工程的命名是為了紀念約翰內斯·古騰堡,他是一位德國15世紀的印刷商,通過發明鉛字活字印刷術推動了印刷機的革命。
1990年代中期,Hart在伊利諾伊本篤會學院進行該項目,更多的志願者參與了進來。在圖像掃瞄器和光學文字識別軟體得到改進並被廣泛使用前,大部分文本都是靠手工輸入。
Hart後來與卡內基梅隆大學達成協定,由對方主導古騰堡工程的財務。隨著電子文本的增加,志願者開始替代Hart,進行日常的維護操作。
2000年,非營利組織古騰堡工程著作歸檔基金會 (The Project Gutenberg Literary Archive Foundation Inc) 在密西西比州獲準成立,以處理相關的法律事務。給古騰堡工程捐款可以得到減稅的優惠。工程的長期志願者Gregory Newby成為基金會的第一任執行長。
同樣是在2000年,Charles Franks啟動了分布校對員項目,志願者從而可以將掃描的文本通過網際網路共享發布。該舉措極大地提高了加入PG的數量與種類,新的志願者也可以更容易地貢獻力量。
義大利志願者Pietro Di Miceli開發、管理了第一個古騰堡工程的網站,並著手對線上工程進行編目。在他參與的10年間(1994年-2000年),網站獲得了不少獎項,
被常收錄到"最佳網頁"列表,這也提高了工程的知名度。
2004年開始,啟用了新的線上目錄,PG內容更容易瀏覽、獲取和連結。
古騰堡工程由位於北卡羅萊納大學的ibiblio主辦。

收錄範圍

到2007年8月為止,古騰堡工程已經收錄了22,000部書籍,平均每周將新增50部。
其中主要是西方文化傳統中的文學作品,比如小說、詩歌、小故事、戲劇,除此之外,PG也收錄食譜、書目以及期刊。另外還包括一些非文本內容,比如音頻檔案、樂譜檔案等。
收錄中主要是英文作品,但也有相當數量的德語、法語、義大利語、西班牙語、荷蘭語、芬蘭語以及中文等不同語言的著作。
在可能的情況下,古騰堡以純文本的格式發布,主要使用ASCII字元集,也常被擴展為ISO-8859-1,而中文書籍幾乎全部都是以Big5大五碼純文本格式發布。志願者提交時也可能會採用其它格式,最常見的是HTML。不容易編輯的格式,比如PDF,對於古騰堡工程的目標而言並不合適,但還是有一些這樣的格式被提交。近年來,有關於XML格式的討論,但相關進展還比較緩慢。

理想

Michael Hart在2004年有言:“古騰堡工程的使命很簡單:鼓勵電子書的創建與發布。”
工程的一個口號是“推倒愚昧與無知的藩籬”,就像20世紀早期公共圖書館的興起,古騰堡的志願者志在繼續推廣文字讀寫,從而更好地繼承文化遺產。
古騰堡工程的運作方式不是集中式的,例如,沒有一項選擇政策來指定要添加哪部著作,志願者只是針對他們感興趣的或者手頭有的著作,進行工作。

著作權問題

古騰堡工程根據美國著作權法對其電子書進行著作權驗證。只有著作權過期者才可以加到PG檔案中來,著作權失效的記錄將保存以備未來參考。
與其它數字圖書館的項目不同,古騰堡工程不會在其出版物上聲明新的著作權,從而鼓勵自由再加工、再發布。
PG的大部分書籍都依照美國的著作權法律,作為公有領域發布。每本電子書中包括了法律措辭,只要使用了古騰堡工程的商標,對書籍本身設限極少 (例如修改後再發布,或者商業用途)。但如果沒有使用商標,共有領域的書籍就可以不受限地再利用。
古騰堡工程也發布了一些受著作權保護的書籍,根據著作權所有者的說明,就有進一步的限制。
1998年的Sonny Bono Copyright Term Extension Act,將現存的著作權延長了20年。這導致本來在美國將變成公有領域的許多書,古騰堡工程無法添加。

批評

古騰堡工程的書籍被指學術上不夠嚴格,比如,缺少版本使用詳情介紹,缺少最初版的封面,缺少校訂工具。通過比較新老版本,可以看到新版的電子書已經有較大改進。大部分新版的電子書都保留了版本信息以及封面。

姐妹項目

古騰堡工程的所有姐妹項目都是獨立的組織,但具有同樣的理念,並獲準使用古騰堡工程的商標。它們一般專注於某些族群或語種。
(1) Project Gutenberg Australia收錄了許多根據澳大利亞著作權法律屬於共有領域,但在美國仍然著作權受限(或者無法確定),特別關注澳大利亞作家以及關於澳大利亞的書籍。
(2) PG-EU根據的是歐盟的著作權法律。它的一個目標是將儘量多的語言包括進來。採用Unicode以確保所有文字都可以正確顯示。
(3) Project Gutenberg of the Philippines針對菲律賓及其語言。
(4) Project Gutenberg Europe由Project Rastko維護,位於塞爾維亞-黑山。2005年啟動,使用分布校對員軟體,以加速電子文本的製作。
(5) Project Gutenberg Luxembourg主要發布盧森堡語的著作
(6) Project Gutenberg Consortia Center,格式不那么嚴格一致,按主題收錄、包括多種語言是其特色。
(7) Projekti Lönnrot由芬蘭的古騰堡志願者啟動。
儘管Projekt Gutenberg-DE數年前被獲準使用古騰堡的名稱,但由於其理念不同,所以並不是每個人都將其看作古騰堡的姐妹站。Projekt Gutenberg-DE對其產品設定著作權,並將其文本限制為可瀏覽的網頁版。

相關詞條

熱門詞條

聯絡我們