重直搜尋

重直搜尋是一項計算機技術。

基本介紹

  • 中文名:垂直搜尋
  • 外文名:Vertical search
  • 類型:計算機技術
A.分散式多執行緒+多進程反防爬的快速Spider技術
B.網頁塊分析/正文抽取技術
C.網頁自定義規則的信息抽取
D.分類/聚類
E.快速中文分詞技術, 日文分詞技術
F.產品識別/產品消重
G.支持多語言(中文、英文、日文等)/編碼格式自動識別
H.搜尋引擎與資料庫無縫集成
I.分散式系統、支持億級數據檢索
(2) 功能列表
A.常用功能
添加採集網站
啟動/停止採集
索引數據結構定義
採集規則定義
抽取規則定義
系統信息瀏覽
B.數據採集
分類管理
網站管理
網站地址管理
URL發生器
地址過濾規則
採集規則定義
抽取規則定義
檔案獲取規則定義
C.數據處理
資料庫連線定義
欄位映射關係
D.產品識別
獨創的機器模糊識別結合人工審批技術
識別管理系統
E.索引系統
詞庫定義
登錄新詞
詞庫瀏覽
添加禁止詞
禁止詞列表
索引數據結構定義
切分設定及權重定義
F.檢索系統
分散式/單機設定
記憶體高速索引模組
各種檢索規則(按相關度/時間/查詢/綜合)
G.後台管理
安全登入
管理員角色/許可權設定
採集執行緒數/深度/時間間隔
數據查看/增刪改
日誌管理
(3) 特點
A.全自動
我們的垂直搜尋系統,支持從信息採集到索引建立到最後滿足各種查詢的信息展示,快速方便
B.高準確度
100%的搜全率和招回率。獨一無二的產品識別技術保證98%以上的產品識別率(適用於價格比較等套用)。
C.資料庫完美支持
支持各種主流資料庫,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等。 我公司現在是美國mysql公司在華獨家認證及培訓代理.
D.高速的檢索速度
記憶體索引,高速cache技術使得檢索在毫秒級別的時間內完成.
E.分散式支持
分散式系統支持,可承受更大數據量。達10TB級別。
F.靈活套用的支持
我們5年的搜尋引擎開發經驗證明:無論你是做何種領域或行業垂直搜尋,無論你要使用的何種數據要達到何種效果。我們的系統都可以針對性的靈活調整採集策略,索引建立方式,識別方式,最精準的滿足需求快速信息搜尋的需要。

熱門詞條

聯絡我們