基本介紹
- 中文名:archive
- 應用程式:archive -archive.exe- 進程信息
- 進程名稱:: BW-based SpyWare
- 出品者: :未知N/A
簡介,歷史,網頁存檔,時光機,Archive-It,收集書目,視頻資料,
簡介
網際網路檔案館(英語:Internet Archive)是一個非營利性的數字圖書館組織。成立於1996年,由Alexa創始人布魯斯特·卡利創辦。提供數字數據如網站、音樂、動態圖像、和數百萬書籍的永久性免費存儲及獲取。迄至2012年10月,其信息儲量達到10PB。除此之外,該檔案館也是網路開放與自由化的倡議者之一。
其數據是由自帶的網路爬蟲自動蒐集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。
該資料庫是國際網際網路保存聯盟成員,2007年被加利福尼亞州選為官方指定圖書館。檔案館收集的數據是各種各樣的。截止2015年年初,網際網路檔案館共收錄了2400款MS-DOS遊戲。
歷史
1996年,卡利在創建盈利性的Alexa Internet時同時也創立了網際網路檔案館;同年10月開始收集存儲數據。不過,直到2001年開發了“時光機”前,這些數據都無法訪問。1999年末擴展收集範圍。
2012年8月,宣布將在其現存的130萬檔案的下載選項中加入BitTorrent。因為通過兩個檔案數據中心協調,這成為從該檔案館下載數據的最快方法。
2013年11月6日,檔案館在里奇蒙德區的總部失火,損壞了許多設備和一些附近的公寓,預計損失達到60萬美元。
網頁存檔
時光機
網站時光機是網際網路檔案館最重要的服務之一。其名取自一部名為The Rocky and Bullwinkle Show的美國卡通片,時光機允許人們去搜尋和訪問其網頁存檔。在一些國家和地區,時光機這個術語的使用已經非常普遍,“時光機”和“網際網路檔案館”甚至開始被當做同義詞使用。
Archive-It
Archive-it是一款幫助機構和個人創建存檔的工具。一旦目標網站的URL被輸入並保存且該網站允許網際網路檔案館所使用的Robots.txt訪問,該網頁將會成為時光機的一部分。截至2014年3月,Archive-it在美國的46個州和其他16個國家共有超過275個機構是其合作夥伴,共有超過74億個網頁的線上存檔。
收集書目
視頻資料
除了上述內容之外,網際網路檔案庫還收集了大量的數字媒體,這些數字媒體均匹配美國公共領域或CC授權協定。這些媒體檔案均會根據媒體類型(moving images、audio、text、etc.)被組織成集合,並根據各項標準被分入子集合。例如大都會藝術博物館提供的相關資料就會被分入一個子集,目前該集合相關資料的數量已經超過了140,000個。每個主集合都含有一個“社區”子集合(以前被稱為“開源”)用於存儲公眾的貢獻。