短小文本分類

短小文本分類

短小文本分類是針對論壇/BBS、留言及回復、諮詢、建議及意見反饋、手機簡訊/網路小紙條、即時聊天記錄(MSN/QQ/POPO)等按照給定的分類體系進行分類,由於文本短小內容較少,短的只有幾十字,多的也就是一百字左右,內容少,特徵不明顯。常用的基於統計與向量空間模型的方法處理效果不好,準確率只有70%左右。 針對這種情況,我們採用基於統計與規則相結合的方法,引入語義範式對短小文本進行分類處理,同時通過人工介入的方法,準確率可以達到90%以上,一般可以達到95%左右。

相關詞條

熱門詞條

聯絡我們