摘要:【目的】利用LSTM模型和字嵌入的方法構建分類系統(tǒng),提出一種中文圖書分類中多標簽分類的解決方案。【方法】引入深度學習算法,利用字嵌入方法和LSTM模型構建分類系統(tǒng),對題名、主題詞等字段組成的字符串進行學習以訓練模型,并采用構建多個二元分類器的方法解決多標簽分類問題,選擇3所高校5個類別的書目數(shù)據(jù)進行實驗。【結果】從整體準確率、各類別精度、召回率、F1值多個指標進行分析,本文提出的模型均有良好表現(xiàn),有較強的實際應用價值。【局限】數(shù)據(jù)僅涉及中圖分類法5個類別,考慮的分類粒度較粗等。【結論】基于LSTM模型的中文圖書分類系統(tǒng)具有預處理簡單、增量學習、可遷移性高等優(yōu)點,具備可行性和實用性。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社