摘要:文本特征項的選擇是文本挖掘和信息檢索的基礎和重要內容。傳統的特征提取方法需要手工制作的特征,而手工設計有效的特征是一個漫長的過程,但針對新的應用深度學習能夠快速地從訓練數據中獲取新的有效特征表示。作為一種新的特征提取方法,深度學習在文本挖掘方面取得了一定的成果。深度學習與傳統方法的主要區別在于,深度學習能自動地從大數據中學習特征而不是采用手工制作的特征,手工制作的特征主要依賴于設計者的先驗知識,很難充分利用大數據;深度學習可以自動地從大數據中學習特征表示,并包括數以萬計的參數。文中概述了用于文本特征提取的常用方法,并闡述了在文本特征提取及應用中常用的深度學習方法,以及深度學習在特征提取中的應用展望。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社