Powerset是美國舊金山的一家搜尋引擎公司,它的搜尋引擎所使用的核心技術自然語言處理技術。這使得Powerset與Google從本質上有區別。 Google依靠的是PageRank技術,即通過一定的統計學方法計算用戶所搜尋的關鍵字在網頁中出現的頻率,從而把相關的結果返回給用戶。
基本介紹
- 中文名:Powerset
- 位置:美國舊金山
- 類別:一家搜尋引擎公司
- 核心技術:自然語言處理技術
公司簡介,公司業務,發展歷程,相關人物,
公司簡介
Powerset是美國舊金山的一家搜尋引擎公司,它的搜尋引擎所使用的核心技術自然語言處理技術。這使得Powerset與Google從本質上有區別。 Google依靠的是PageRank技術,即通過一定的統計學方法計算用戶所搜尋的關鍵字在網頁中出現的頻率,從而把相關的結果返回給用戶。
公司業務
Powerset致力於構建一個能回答用戶問題的自然語言搜尋引擎(區別於基於關鍵字的搜尋)。舉個例子,當用戶輸入一個問題,"Which United Statesstate has the highest income tax?",通常搜尋引擎會忽略掉疑問詞,進而使用keywords "state"、 "highest"、"income"和"tax"來搜尋。Powerset與之不同,它試圖通過自然語言處理來理解問題的本質,並返回含有答案的網頁。
通過beta測試方式,2007年9月17日,Powerset開放了一個叫Powerlabs的線上社區。Business Week說,"這家公司希望這個網站能夠集合數千人來幫助構建和改進它的搜尋引擎,以迎接來年的公開服務。"。The New York Times說: "[Powerset Labs]比大多數軟體項目的alpha測試和beta測試更進一步,別的軟體項目把產品放在嚴苛的環境下工作以便找出其漏洞,Powerset還沒有一個產品,它是一個自然語言技術的集合,這些技術來自於Xerox PARC數年的研究成果。"
Powerset 已經正式獲得了PARC(施樂公司旗下的著名的帕洛阿爾托研究中心)所研發的自然語言處理技術的獨家使用權。這種自然語言處理技術將使得Powerset搜尋引擎能理解用戶所搜尋的關鍵字的含義以及多個關鍵字之間的關聯,從而找出符合人類思維的真正的相關結果。這將使得 Powerset的搜尋引擎具備從現有的搜尋市場突圍而出的條件。Powerset從去年開始就與PARC進行了有關這項技術的商談,現在終於成功。
發展歷程
現在,這家公司正在"構建一個能讀入和理解Web所有句子的自然語言搜尋引擎"。這家公司從PARC, 之前的Xerox Palo Alto Research Center取得自然語言技術的授權。
2008年5月11日,這家公司開放了一個搜尋維基百科特定的部分頁面的小工具,它使用常用的語句而不是關鍵字。
2008年7月1日微軟1億美金收購了Powerset,之後微軟大力宣傳web 3.0技術的Powerset語義搜尋,在搜尋引擎新一代的語義搜尋項目中,Powerset目前占有重要地位。