摘要:隨機森林(RF)具有抗噪能力強,預測準確率高,能夠處理高維數據等優點,因此在機器學習領域得到了廣泛的應用。模型決策樹(MDT)是一種加速的決策樹算法,雖然能夠提高決策樹算法的訓練效率,但是隨著非純偽葉結點規模的增大,模型決策樹的精度也在下降。針對上述問題,提出了一種模型決策森林算法(MDF)以提高模型決策樹的分類精度。MDF算法將MDT作為基分類器,利用隨機森林的思想,生成多棵模型決策樹。算法首先通過旋轉矩陣得到不同的樣本子集,然后在這些樣本子集上訓練出多棵不同的模型決策樹,再將這些樹通過投票的方式進行集成,最后根據得到的模型決策森林給出分類結果。在標準數據集上的實驗結果表明,提出的模型決策森林在分類精度上明顯優于模型決策樹算法,并且MDF在樹的數量較少時也能取到不錯的精度,避免了因樹的數量增加時間復雜度增高的問題。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社