文本挖掘(網路熱詞)_中文百科全書

文本挖掘是網路熱詞。文本挖掘是從非結構化的文本信息中抽取潛在的、用戶感興趣的重要模式或知識的過程,可以把它看作數據挖掘或資料庫中知識發現的延伸。對文本信息的挖掘主要是以數理統計學和計算語言學為理論基礎,讓計算機發現某些文字出現的規律以及文字與語義、語法間的聯繫。文本挖掘涉及多個學科領域,如信息檢索、文本分析、信息抽取等。