摘要:【目的】針對短文本分類中的內容稀疏問題,提出一種基于類別特征擴展的短文本分類方法。【方法】使用改進后的TF-IDF模型以及LDA主題模型構建基于類別特征的關鍵詞集與主題分布集,完成對短文本內容及詞匯向量表征上的擴充,并在此基礎上通過卷積神經網絡對短文本分類。【結果】實驗結果表明,基于類別特征擴展后的短文本在分類的準確率上提升3%,在召回率上提升4.1%。【局限】僅使用卷積神經網絡進行驗證。【結論】基于類別特征擴展的短文本分類方法能夠克服短文本分類中的內容稀疏問題,提高短文本分類的性能。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社