Havenask

Havenask是阿里巴巴內部廣泛使用的大規模分散式檢索系統,支持了包括淘寶、天貓、菜鳥、高德、餓了么、全球化在內整個阿里巴巴集團的搜尋業務,為用戶提供高性能、低成本、易用的搜尋服務。

同時具有靈活的定製和開發能力,支持算法快速疊代,幫助客戶和開發者量身定做適合自身業務的智慧型搜尋服務,助力業務增長。

2022年12月,Havenask項目檔案在Github推出。

2023年10月,Havenask開源官網正式發布。

基本介紹

  • 中文名:Havenask
  • 開發公司:阿里巴巴
  • 分類:開源搜尋引擎
產品簡介,發展歷程,整體架構,企業及解決方案,

產品簡介

Havenask 底層全部採用 C++ 實現,並經過多年的最佳化疊代,與其他的開源搜尋引擎相比具有如下特點:
  • 高性能:查詢性能高,某些場景性能數倍於開源引擎。
  • 低成本:支持存算分離,冷熱數據隔離等功能,海量數據場景下成本更低。
  • 時效性高:數據寫入或者更新的時效性可以達到毫秒級。
  • 穩定性高:記憶體控制嚴格,沒有其他開源引擎 gc 的問題,同時支持多機房互備具有更高的可靠性。
  • 索引類型豐富:支持 kv、kkv、倒排、正排、摘要、向量多種索引類型。
  • 定製能力強:支持分詞器、數據處理、query 改寫、算分、功能函式、等多種外掛程式的定製。
  • 支持 SQL 語法:支持 SQL 查詢,多表 join,學習門檻低,業務遷移方便。

發展歷程

Havenask在阿里集團內部有著10多年的發展歷史,通過性能和穩定性的成績在集團內廣泛套用,豐富的定製化能力,支撐了集團內所有核心的搜尋業務場景,累積了很多針對搜尋場景的功能及性能最佳化經驗。
  1. 1999年~2008年起源於雅虎搜尋技術(YST、Vespa)的單機版搜尋引擎,支持淘寶、B2B等子公司搜尋業務。
  2. 2009年~2011年完成自研搜尋引擎HA3(Havenask)研發,開啟自研大規模分散式高性能搜尋引擎時代。
  3. 2013年Havenask支持阿里巴巴集團幾乎所有搜尋業務,統一代碼分支,以產品化方式規模化支持集團大量搜尋業務。
  4. 2018年深度學習技術廣泛套用,Havenask繼續演進,除了提供傳統的倒排索引能力外,還提供KV、KKV、向量索引,支持深度模型和線上預測,提供外掛程式定製、自研CAVA語言支持業務擴展等能力,成為阿里搜推廣場景的核心AI智慧型引擎。
  5. 2022年阿里將搜尋引擎 Havenask 開源,為更多用戶提供更高性能、更低成本、更便捷易用的搜尋服務。
Havenask
Havenask發展歷程

整體架構

Havenask
Havenask 架構
從架構來看,Havenask 由四個核心模組組成

企業及解決方案

熱門詞條

聯絡我們