Transwarp Hippo是一款企業級雲原生分散式向量資料庫,支持存儲,索引以及管理向量式數據集,能夠高效的解決向量相似度檢索以及高密度向量聚類等問題。Hippo具備高可用、高性能、易拓展等特點,支持多種向量搜尋索引,支持數據分區分片、數據持久化、增量數據攝取、向量標量欄位過濾混合查詢等功能,能夠很好的滿足企業針對向量數據的高實時性檢索等場景。
基本介紹
- 中文名:星環分散式向量資料庫
- 外文名:Transwarp Hippo
產品優勢,套用場景,
產品優勢
雲原生系統:Hippo 採用全面容器化部署,支持服務的彈性擴縮容;同時具備多租戶和強大的資源管控能力。
分散式部署:具備分散式部署能力,滿足大規模集群部署需求; 通過 Raft 算法確保數據的強一致性;同時提供故障遷移,數據修復等數據保障能力。
企業級安全:Hippo 可提供基於 SASL 的用戶認證能力,以及基於 SSL/TLS 的數據加密傳輸。
高性能檢索:Hippo 支持多進程架構與 GPU 加速,可以充分發揮並行檢索能力;同時支持多類索引,滿足不同業務場景;支持檢索速度和記憶體使用的特定最佳化,支持暫存器級算法最佳化。
多模型聯合分析:基於多模型統一技術架構,向量數據與關係型數據、圖數據、時序數據等多種模型數據進行統一存儲管理,通過統一接口實現數據跨模型聯合分析。
接口多樣化:提供類SQL 語法支持; 提供標準的 Python、Restful、CPP、Java API。
套用場景
文本檢索:傳統搜尋引擎更偏向於詞、句的精確查詢,Hippo 通過向量引擎提供自然語言處理能力,可以更好的支持基於語義的查詢分析,讓查詢更滿足人性化的需求。
語音/圖像/視頻檢索:通過機器學習分析,各類數據可以被抽象成高維向量特徵,Hippo 則可以將所有特徵構建成高效的向量索引,用戶可以基於向量索引實現數據的相似性檢索,可以覆蓋各類 AI 場景,如人臉識別、語音識別、視頻指紋等。
個性化推薦:Hippo 支持與各類深度學習平台搭建的模型進行耦合,分析、挖掘用戶行為與喜好等多方面相關數據向量化存儲,通過向量相似度檢索,將用戶可能整興趣的信息推送給客戶,做到千人千面的推薦效果。
大模型套用:Hippo 可以作為 LLM 的中間載體承載 LLM 生成的各類內容,有效擴展 LLM 的時間與空間邊界,使大模型擁有“長期記憶”,並協助解決企業擔憂的大模型泄露隱私問題。