超文本數據

超文本定義

超文本(Hypertext)是用超連結的方法，將各種不同空間的文字信息組織在一起的網狀文本。超文本更是一種用戶介面範式，用以顯示文本及與文本之間相關的內容。現時超文本普遍以電子文檔方式存在，其中的文字包含有可以鏈結到其他位置或者文檔的連結，允許從當前閱讀位置直接切換到超文本連結所指向的位置。超文本的格式有很多，目前最常使用的是超文本標記語言(Hyper Text Markup Language，HTML)及富文本格式 (Rich Text Format，RTF)。我們日常瀏覽的網頁上的鏈結都屬於超文本。

一種按信息之間關係非線性地存儲、組織、管理和瀏覽信息的計算機技術。超文本技術將自然語言文本和計算機互動式地轉移或動態顯示線性文本的能力結合在一起，它的本質和基本特徵就是在文檔內部和文檔之間建立關係，正是這種關係給了文本以非線性的組織。概括的說，超文本就是收集，存儲磨合瀏覽離散信息以及建立和表現信息之間關聯的技術。

超文本是由若干信息結點和表示信息節點之間相關性的鏈構成的一個具有一定邏輯結構和語義關係的非線性網路。HTML只是超文本語言的一種，JSS與CSS,VB等也屬於超文本的範疇。

超文本數據是怎樣的一種結構

超文本技術是一種按信息之間關係非線性地存儲、組織、管理和瀏覽信息的計算機技術。

超文本與超文本協定的區別：

超文本

是與其它數據有關聯(links)的數據。包含與其他文檔連結的文檔；選擇連結時自動顯示第二個文檔。

超文本傳輸協定（http）：

支持www上信息交換的internet標準，是定義web伺服器如何回響檔案請求的internet協定。

Web數據挖掘-超文本數據的知識發現

《Web數據挖掘-超文本數據的知識發現(英文版)》

本書是信息檢索領域的名著，深入講解了從大量非結構化Web數據中提取和產生知識的技術。書中首先論述了Web的基礎(包括Web信息採集機制、Web標引機制以及基於關鍵字或基於相似性搜尋機制)，然後系統地描述了Web挖掘的基礎知識，著重介紹基於超文本的機器學習和數據挖掘方法，如聚類、協同過濾、監督學習、半監督學習，最後講述了這些基本原理在Web挖掘中的套用。本書為讀者提供了堅實的技術背景和最新的知識。

本書是從事數據挖掘學術研究和開發的專業人員理想的參考書，同時也適合作為高等院校計算機及相關專業研究生的教材。

1　INTRODUCTION

1.1　Crawling and Indexing

1.2 Topic Directories

1.3 Clustering and Classification

1.4 Hyperlink Analysis

1.5 Resource Discovery and Vertical Portals

超文本數據

基本介紹

超文本定義

超文本數據是怎樣的一種結構

超文本與超文本協定的區別：

超文本

超文本傳輸協定（http）：

Web數據挖掘-超文本數據的知識發現

超文本數據傳輸協定

相關詞條

熱門詞條