基本介紹
- 中文名:阿拉丁計畫
- 概述 :阿拉丁計畫是新一
- 阿拉丁計畫:用阿拉丁計畫命名,寓含著
- 為什麼推出:能被搜尋引擎檢索到的信
定義,意義,含義,
定義
用阿拉丁計畫命名,寓含著百度的這個平台可以像神燈那樣幫助用戶實現最便捷地獲取信息的願望。
意義
能被搜尋引擎檢索到的信息只占所有信息中非常小的一部分,大部分信息存沒有被任何搜尋引擎編列索引,以至於無法通過搜尋引擎找到他們。這些未被收錄的信息即在“暗網”之中。
要明白為什麼推出百度百度阿拉丁計畫?先來簡單了解下“暗網”的分類。
1、由於技術的原因,很多網站本身不規範、或者說網際網路本身缺少統一規則,導致了搜尋引擎的爬蟲無法識別這些網站內容並抓取,這不是搜尋引擎自身就能解決的問題,而是有賴整個網路結構的規範化。
2、很多網站因多種原因根本就不願意被搜尋引擎抓取,robots禁止了搜尋引擎的抓取。第二種暫且不做研究,因如果搜尋引擎去抓取那些信息就屬於違法了。
“暗網”包含100億個不重複的表單,其包含的信息量是“非暗網”的40倍,有效高質內容總量至少是後者的1000倍到2000倍。
如何能將這些允許被搜尋卻因網站不規範原因而未被搜尋的網站的有用信息呈現給大家呢?百度“阿拉丁計畫”就是要從根本解決這一問題的。
正是認識到“暗網”信息的存在和巨大價值,百度開始著手啟動“阿拉丁平台”研發計畫,期望能挖掘出更多存在於“暗網”之中的有價值信息,將更多的已知和未知信息分門別類融合,有序納入搜尋體系。
含義
阿拉丁計畫旨在超越現有Web內容的限制,對包括眾多未納入搜尋引擎檢索體系的“暗網”在內的所有信息進行更深一步的分析、融合、處理,以使這些信息能最富有效率地被用戶通過搜尋引擎進行檢索,從而逐步實現“只在一個最為簡單的搜尋框裡面,蘊藏了全人類最為豐富多彩的信息世界!
大大增加對用戶有用信息的可讀性。即所謂照亮“暗海”。