第一代
分類目錄時代
不知道大家時候在自己的搜尋引擎首頁是否有設定過導航網站這個網址作為自己的首頁呢?其實這個網址就是搜尋引擎第一代的代表。我們可以從這個導航網站這個網站裡面看到,裡面幾乎都是一些分類網址,幾乎在網際網路上的,這個網站裡面都一應俱全,從這裡我們可以看出,這個網站是一個導航網站,也可以說分類目錄網站,用戶可以從這個分類目錄里找到自己想要的東西,這就是搜尋引擎第一代。
第二代
文本檢索時代
到了這一代,搜尋引擎查詢信息的方法則是通過用戶所輸入的查詢信息提交給伺服器,
伺服器通過查閱,返回給用戶一些相關程度高的信息。這代的搜尋引擎的信息檢索模型主要包括例如布爾模型、機率模型或者向量空間模型。通過這些模型來計算用戶輸入的查詢信息是否與網頁內容相關程度高低,將相關度高的則返回給用戶。採取這種模式的搜尋引擎主要是一些早期的搜尋引擎,例如像Alta Vista、Excite等等。這就是搜尋引擎第二代。
第三代
整合分析時代
這一代的搜尋引擎所使用的方法大概是和我們今天的網站的外部連結形式基本相同,在當時,外部連結代表的是一種推薦的含義,通過每個網站的推薦連結的數量來判斷一個網站的流行性和重要性。然後搜尋引擎再結合網頁內容的重要性來和相似程度來改善用戶搜尋的信息質量。這種模式的首先使用者是google,google不僅為首次使用並且大獲成功,這一成就在當時引起了學術界和其他商業搜尋引擎的極度關注。後來,學術界以此成就為基礎,提出了更多的改進的連結分析算法。大多數的主流搜尋引擎都在使用分析連結技術算法。這就是第三代搜尋引擎
將用戶輸入關鍵字,反饋回來的海量信息,智慧型整合成一個入口網站式的界面,讓用戶感覺每個關鍵字,都是一個完整的信息世界。而不是第二代一樣返回一個清單,整個清單夾雜著大量用戶不關心、且沒有分類的連結。第三代搜尋引擎的典型特徵就是:智慧整合第二代返回的信息為立體的界面。讓用戶能輕易地一眼進入到最相關的分類區域去獲取信息。
第四代
用戶中心時代
第四代,也就是我們所用的搜尋引擎技術也是網際網路上面用的最普遍的。主要是以用戶為中心。當客戶輸入查詢的請求時候,同一個查詢的請求關鍵字在用戶的背後可能是不同查詢要求。例如用戶輸入的是“蘋果”,那么作為一個想要購買iPhone的用戶和一個果農來說,那么要求就是大大的不一樣。甚至是同一個用戶,所查詢的關鍵字一樣,也會因為所在的時間和所在的場合不同而返回的結果不同的所有主流搜尋引擎,都在致力於解決同一個問題:怎樣才能從用戶所輸入的一個簡短的關鍵字來判斷用戶的真正查詢請求。這一代搜尋引擎主要是以用戶為中心。這就是第四代搜尋引擎。
移動設備的使用者,即使不向移動搜尋網際網路授權任何特徵信息,移動搜尋網際網路仍然可以通過移動設備使用者在的搜尋時的大量特徵,比如上網的時間習慣,操作習慣,內容歸類去逐漸勾勒出這人使用者的特徵信息,這種“推測式”算法的可能性也是由於移動設備具有唯一性、隨身性而產生的。這好比是警察可能通過“嫌疑人”的行為習慣,去推測出他的“作案動機”與“體貌特徵”一樣。那么,這些使用者的蛛絲馬跡,都是未來移動網際網路搜尋引擎進行“商業數據挖掘”的巨大寶藏。
移動網際網路搜尋的必然使命,就是:提供精準到個人的搜尋。可以說前三代搜尋引擎,都是基於PC網際網路的搜尋,而精準到個人需求的移動網際網路搜尋,為“第四代搜尋引擎”,那么,最有可能實現這個第四代搜尋引擎的人才,可能不來自於百度,甚至不來自於GOOGLE,而很有可能來自於亞馬遜、淘寶這些掌握了大量個人信息的商業巨頭,或者來自於跨界研究行為心理學、消費心理學、社會心理學等背景的IT研究機構或IT創業團隊,因為這些公司或機構,對人們的行為習慣背後的“動機”與“特徵”更加了如指掌。
第五代
生活生態圈
第五代搜尋引擎應該是基於物聯網的搜尋,物聯網搜尋擁有更廣闊的搜尋空間,現在能預測到物聯網一個最典型的套用就是:找東西!比如遠程看管小孩、老人,或搜尋走失小孩,包括精確到厘米的GPS定位,比如你去一個陌生的地方,找廁所,找視窗,甚至找警察。同時,不僅僅是你找東西,甚至還有可能東西找你,比如泊車後超過某個時間點,讓車主動呼叫你,飯煮好了,電飯堡呼叫你,提前打開的空調使用室溫保持到預定溫度後,空調呼叫你等等。
總結
直到現在,基於第四代搜尋引擎未能解決的問題,很多主流的搜尋引擎都做了許多的技術嘗試,比如像根據用戶所輸入的查詢請求和用戶所處在的地理位置來判斷用戶的真正查詢請求,又或者根據用戶輸入的查詢信息和用戶之前訪問的歷史記錄相結合來判斷用戶的真正查詢請求,但是在效果上卻是微乎其微。這個問題何時才能突破,讓我們拭目以待吧。