信息源可信度量,屬於信息檢索的範疇,是指在泛在網路的環境下,根據信息源的社會特徵、發布內容、來源設備等因素,對信息源的可信程度的綜合評估。信息源可信度量的方法可根據其影響因素分為基於信息源社會特徵的度量方法、基於內容特徵的度量方法、基於設備認證的度量方法以及綜合多種因素的度量方法。
基本介紹
- 中文名:信息源可信度量
- 外文名:Information Source credibility
- 分類:可信與隱私保護
定義,影響因素,度量方法,基於信息源社會特徵的度量方法,基於內容特徵的度量方法,基於感知設備認證的度量方法,
定義
信息源的可信度量是指度量信息發布方傳遞的信息被信息接收方所信賴以及認可的程度的方法。信息源的可信度包含專業性(Expertise)和可信任性(Trustworthiness)兩個關鍵要素。
影響因素
在網路空間中,信息源可信度的影響因素主要包括信息源的信譽度、信息源中的內容特徵與來源設備特徵。信息源信譽度主要是指網站的線上社交網路中用戶的影響力。信息源中內容特徵可分表義特徵與語義特徵。語義特徵主要指信息內容的相關性、完整性、客觀性、及時性、真實性、新穎性等。表義特徵主要包括參考文獻的來源單位信譽度、內容字數、語言的規範程度等。來源設備特徵主要是指物聯網中感知設備的認證等級。
度量方法
根據影響因素的不同,信息源可信度的度量方法主要包括以下3類方法,分別是基於信息源社會特徵的度量方法、基於內容特徵的度量方法與基於設備認證的度量方法。
基於信息源社會特徵的度量方法
此類方法常套用於線上社交網路的信息源可信度量,主要通過基於信息發布用戶的冬粉數、明星冬粉數、明星好友數、點讚數等社會關係特徵所體現的用戶影響力來度量信息源的可信度。例如, Castillo 等人通過選取Twitter中的用戶特徵(冬粉數、好友數),結合其所發的tweet的轉發數、評論數、傳播深度等特徵評估Twitter信息的可信度。另外,這種方法也可用於針對網站類的信息源可信度評價,例如Hong等學者分析了站點域名(如org, com, net等)與網站隸屬關係對可信度的影響,發現具有商業意圖的網站可信度不如政府機構或公益組織運行的網站可信度。
基於內容特徵的度量方法
一般而言,內容質量越高的信息源,其可信度越高。Fogg等學者在2002年的研究指出在信息內容中參考文獻方面,如果存在一定數量來自可信度高的參考文獻能增加信息源的可信度。莫祖英等人基於微博數據中的信息內容質量與超連結質量,採用層次分析法構建了微博個人用戶信息源可信度的度量模型。另外,Metzger的研究還發現,如果網站的資源下載和傳播速度,能夠增加該網站信息源的可信度。
基於感知設備認證的度量方法
基於設備認證的度量方法是由於泛在網感知設備數量規模過大,導致感知設備的認證和信任管理成為信息檢索套用中需要解決的問題。瑞士蘇黎世聯邦理工學院Frank等學者針對蜂窩網連線的感知設備,提出了通過AKA協定的感知設備認證方法來度量信息源可信度。針對M2M群組,美國麻薩諸塞大學的Yan等人的研究給出了許多解決方案。然而,當前基於感知設備認證的度量方法存在的問題主要是設備管理和認證協定主要基於運營商提供,相關認證能力對套用層用戶的開放仍有待於解決。
另外,還有許多研究是結合多種影響因素綜合度量信息源的可信度,例如薛傳業等人從信息源的社會特徵、傳播路徑、正文內容和評論內容4個方面綜合評價突發事件中社交媒體信息源可信度,類似的度量方法還有Fritch等人的研究。