以文本(如字元、數字、標點、各種可列印的符號等)作為數據形式的非結構化的數據;非結構化或半結構化文本數據的典型代表是圖書館資料庫中的文檔,這些文檔可能包含結構欄位,如標題、作者、出版日期、長度、分類等,也可能包含大量非結構化文本成分,如摘要和正文內容。
基本介紹
- 中文名:非結構化文本數據
- 定義:數據形式的非結構化的數據
- 舉例:摘要和正文內容
- 數據:XML、HTML
以文本(如字元、數字、標點、各種可列印的符號等)作為數據形式的非結構化的數據;非結構化或半結構化文本數據的典型代表是圖書館資料庫中的文檔,這些文檔可能包含結構欄位,如標題、作者、出版日期、長度、分類等,也可能包含大量非結構化文本成分,如摘要和正文內容。
非結構化數據是數據結構不規則或不完整,沒有預定義的數據模型,不方便用數據庫二維邏輯表來表現的數據。包括所有格式的辦公文檔、文本、圖片、XML, HTML、各類報表...
以文本(如字元、數字、標點、各種可列印的符號等)作為數據形式的非結構化的數據;非結構化或半結構化文本數據的典型代表是圖書館資料庫中的文檔,這些文檔可能包含...
和普通純文本相比,半結構化數據具有一定的結構性,OEM(Object exchange Model)是一種典型的半結構化數據模型。...
非結構化補充數據業務(USSD,Unstructured Supplementary Service Data)是全球移動系統(GSM)通信技術,可用於在行動電話和網路中的應用程式之間傳送文本。...
非結構化補充服務數據(英語:Unstructured Supplementary Service Data,縮寫USSD)有時也稱快速碼(Quick Codes)或功能碼(Feature codes),或譯非結構化數據業務、非結構...
數據項是數據結構中討論的最小單位,是數據記錄中最基本的、不可分的有名數據單位。非結構數據項是指數據項不規則或不完整,沒有預定義的數據類型,不方便用數據庫...
《TRIP非結構化數據庫及其搜尋引擎技術與套用》是2014年出版的圖書,作者是練亞純。... 2.2 TRIP數據庫基礎 462.2.1 記錄與元記錄 462.2.2 檔案結構 48...
TRS 是英文Text Retrieval System(文本檢索系統)的縮寫,他是拓爾思公司的註冊商標...實現對結構化數據和非結構化數據的統一管理和全文檢索,同時,採用分散式集群架構,...
北京智海創訊信息技術有限公司成立於2012年2月,是一家專注于海量結構化及非結構化信息處理技術,提供相關軟體研發、銷售和技術服務的高科技服務型企業。在信息搜尋、...