摘要:特征選擇是機器學習領域的重要課題,基于互信息的特征選擇算法在多個領域得到了廣泛應用.但是該類方法忽略了屬性之間的相互作用對決策結果的影響,無法滿足高維特征數據集的分類要求.針對這類問題,提出一種引入鄰域判別指數的混合式特征選擇算法NDI RF.首先在特征過濾階段,利用鄰域判別指數作為判決指標,通過圖論聚類思想去除冗余特征,獲得相關聯的代表特征集;然后通過改進隨機森林封裝器的特征分配機制,結合序列后項搜索策略評估各個特征子集的分類效果;最終通過逐次迭代選擇最高分類準確率所對應的特征子集作為最優特征子集.在UCI數據集上的實驗結果表明,NDI RF算法相較于其他特征選擇算法,能夠有效地減少最優特征子集的大小,同時保證較高的分類準確率.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社