Sphinx是一個基於SQL的全文檢索引擎,可以結合MySQL,PostgreSQL做全文搜尋,它可以提供比資料庫本身更專業的搜尋功能,使得應用程式更容易實現專業化的全文檢索。Sphinx特別為一些腳本語言設計搜尋API接口,如Java,PHP,Python,Perl,Ruby等,同時為MySQL也設計了一個存儲引擎外掛程式。
Sphinx 單一索引最大可包含1億條記錄,在1千萬條記錄情況下的查詢速度為0.x秒(毫秒級)。Sphinx創建索引的速度為:創建100萬條記錄的索引只需 3~4分鐘,創建1000萬條記錄的索引可以在50分鐘內完成,而只包含最新10萬條記錄的增量索引,重建一次只需幾十秒。
Sphinx的主要特性包括:
高速索引 (在新款CPU上,近10 MB/秒); 高速搜尋 (2-4G的文本量中平均查詢速度不到0.1秒); 高可用性 (單CPU上最大可支持100 GB的文本,100M文檔); 提供良好的相關性排名 支持分散式搜尋; 提供文檔摘要生成; 提供從MySQL內部的外掛程式式存儲引擎上搜尋 支持布爾,短語, 和近義詞查詢; 支持每個文檔多個全文檢索域(默認最大32個); 支持每個文檔多屬性; 支持斷詞; 支持單位元組編碼與UTF-8編碼;
基本介紹
- 中文名:斯芬克司
- 外文名:Sphinx
- 基礎:SQL
- 本質:全文檢索引擎
- 全名:SQL Phrase Index