* Scirus 是專門用於科技信息檢索的世界上最全面的科技搜尋引擎。 Scirus 與其它搜尋引擎最大的區別在於,其既可以搜尋網站(Web),也可以搜尋期刊資源,而且專注於科技方面的內容。Scirus已於2014年初停止服務。
基本介紹
- 外文名:Scirus
- 目的:科技信息檢索
- 定義:世界上最全面的科技搜尋引擎
涵蓋資源,優點,查詢方式,檢索結果,
涵蓋資源
* Scirus可檢索免費資源和期刊資源。涵蓋超過1.05億個與科技相關的網站,包括9,000萬個網頁,以及1,700萬個來自其它信息源的記錄,這些信息源包括:Science Direct, IDEAL, MEDLINE on BioMedNet, Beilstein on ChemWeb, US Patent Office, E-Print ArXiv, Chemistry Preprint Server, Mathematics Preprint Server, CogPrints和NASA等。
* 包括1280萬條MEDLINE文摘;
* 160萬篇ScienceDirect全文;
* 90萬項USPTO的專利;
* 近66萬篇Beilstein文摘;
* 近25萬篇IDEAL全文;
* 10310篇NASA技術報告;
* 將近20萬篇來源於E-Print ArXiv的電子文獻;
* 1410篇來源於CogPrints的電子文獻;
* 565種來自Mathematics Preprint Server的預印本;
* 820篇來源於BioMed Central的全文;
* 565條來源於Neuroscion的新聞;
* 465種來自Chemistry Preprint Server的預印
文獻類型:論文、專利、技術報告、新聞等(文摘、全文)
學科領域:農業與生物學,天文學,生物科學,化學與化工,計算機科學,地球與行星科學,經濟、金融與管理科學,工程、能源與技術,環境科學,語言學,法學,生命科學,材料科學,數學,醫學,神經系統科學,藥理學,物理學,心理學,社會與行為科學,社會學等
獲取途徑:免費瀏覽所有檢索到的網際網路主頁的信息。Scirus提供的期刊資源可以免費查看題錄和文摘。但是,獲取非免費期刊全文需要預先註冊並支付費用。
優點
Scirus,除了其高級搜尋的用戶選項較多以外,它還使 用一個特殊的敘詞表來收錄相關的科學辭彙。在與慕尼黑大學(University of Munich)的計算語言學系(Computational Linguistics Department)的合作基礎上,Scirus確定了超過50,000個敘詞,涵蓋所有專業科學領域的科學敘詞表,以保證檢索效率。系統對每次搜尋到 的信息內容會自動抽取反映主題內容的關鍵字,以列表的形式顯示在搜尋結果的右側,點擊列表中的某一個詞,系統會自動添加到檢索式中,對上一次的搜尋結果再 實施一次限定檢索,這對於縮小一項檢索是非常有效的。若在檢索詞列表中沒有所需的檢索詞,可在檢索詞列表下的二次檢索框內輸入檢索詞,進行二次限制檢索, 以進一步提高搜尋的專指性,這是一般的搜尋引擎所無法比擬的。
查詢方式
將查詢結果限定在某一時間段內,Scirus提供的搜尋範圍從1920年起到現在 按照出版日期範圍查詢。此方法特別適用於查詢最新的學術文獻,如只查詢2005年的文獻等等
就 信息類型 (information type)查詢。如科學會議、摘要、科學家主頁及專利等八種類型 按照出版物名稱查詢。如果想對特定出版物查詢相關主題,這是一個好方法;但是由於許多出版物有多種拼法,所以用戶可能需要多試幾次才能找到。如 Journal of Biological Chemistry經常會被縮寫為J Biol Chem
就html或者PDF等檔案格式(file format)查詢。正如Scirus網頁中所說的,大量的學術論文僅公布PDF格式檔案,因而,PDF格式的檔案的標引、檢索對於一個專業的科學搜尋引擎來說是至關重要的 按照作者查詢。這是一個非常有效地獲得專家文獻的方法
就 內容來源(content sources)查詢。用戶既可以從期刊中,如Beilstein on ChemWeb、ScienceDirect中查詢,也可以從NASA、US Patent Office的Web網頁中查詢所需信息 搜尋詞限於文章標題或者全文的查詢
在一定主題範圍(subject areas)內查詢。包括:天文學、數學、物理、經濟、法律等20個專業學科,學科的排列是按照字母順序展開的 可選擇頁面顯示搜尋結果數量,每個頁面顯示結果最高可達100個
檢索結果
Scirus的檢索結果
Scirus 為了能夠精確地蒐集相關的科學信息,它使用了倒置的金字塔技術來描述蒐集過程。在過程中的每一個層次,數據都進行了嚴格地過濾。位於倒置的金字塔頂端的是 種子列表(Seed List),它是Scirus進行網際網路搜尋信息的基礎。在其中,有多種途徑為種子列表加入資源。
Scirus使用一個機器人(就好像網路螞蟻或爬蟲一樣)來讀取在種子列表的信息。不像通用型搜尋引擎,Scirus的機器人不會去搜尋資源的連結網頁,除非種子列表中包含有其鏈 接的網頁。這種做法主要是僅為科學資源做標引,以確保精確檢索。舉例來說,如果Scirus在對某網站進行搜尋,那么這個網站連結到的谷歌網站則不會被搜尋,因為谷歌網站不在種子列表中。
當機器人對種子列表進行搜尋時,Scirus從所搜尋的科學資源下載信息。然後將信息歸類(classification)並建立索引(index)和等級(rank)以供用戶查詢使用。
為了保證檢索結果的有效性,Scirus通過以下幾種方式來顯示檢索結果:
■ 它合併一個網站下的多個相關的網頁。儘管網頁間的內容不一樣,但是因為從屬於一個網站下,所以很多網頁的信息是非常相似的。用戶如果在顯示結果後點擊“more hits from”,Scirus將會顯示在同一網站下的更多的相關匹配結果;
■ 在檢索結果中列明出處,以保證用戶清楚地知道哪些結果是來自Web網頁,哪些結果是來自資料庫。如果我們檢索結果中的文獻信息來自BioMed Central,結果中除了給出文章的主題、作者、摘要等相關信息,還在末尾顯示“full text article available from BioMed Central”;
■ 可以將檢索結果保存及通過電子郵件郵寄到指定的地址。