樂思新聞採集系統

樂思新聞採集系統是樂思軟體公司推出的專門用於採集網路新聞的網路採集軟體。

基本介紹

  • 中文名:樂思新聞採集系統
  • 類型:軟體
  • 用途:採集網路新聞
  • 公司:樂思軟體公司
主要功能,系統特點,運行環境,

主要功能

樂思新聞採集系統的主要功能為:根據用戶自定義的任務配置,批量而精確地抽取目標網路媒體欄目中的新聞或文章,轉化為為結構化的記錄(標題,作者,內容,採集時間,來源,分類,相關圖片等),保存在本地資料庫中,用於內部使用或外網發布,快速實現外部信息的獲取。 功能示意圖如下所示:
樂思新聞採集系統概念圖

系統特點

對目標網站進行信息自動抓取,支持HTML頁面內各種數據的採集,如文本信息,URL,數字,日期,圖片等。
用戶對每類信息自定義來源與分類
可以下載圖片與各類檔案,如PDF,Flash等
支持用戶名與密碼自動登錄
支持命令行格式,可以Windows任務計畫器配合,定期抽取目標網站
支持記錄唯一索引,避免相同信息重複入庫
支持智慧型替換功能,可以將內容中嵌入的所有的無關部分如廣告去除
支持多頁面文章內容自動抽取與合併
支持下一頁自動瀏覽功能
數據直接進入資料庫而不是檔案中,因此與利用這些數據的網站程式或者桌面程式之間沒有任何耦合
支持資料庫表結構完全自定義,充分利用現有系統
支持多個欄目的信息採集可用同一配置一對多處理
保證信息的完整性與準確性,絕不會出現亂碼
支持各種主流資料庫,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等

運行環境

作業系統:Windows XP/NT/2000/2003
記憶體: 最低32M記憶體,建議128M或以上
硬碟: 最少20M空餘硬碟空間

相關詞條

熱門詞條

聯絡我們