摘要:隨著大數據和網絡的不斷發展,網絡調查越來越廣泛,大部分網絡調查樣本屬于非概率樣本,難以采用傳統的抽樣推斷理論進行推斷,如何解決網絡調查樣本的推斷問題是大數據背景下網絡調查發展的迫切需求。本文首次從建模的角度提出了解決該問題的基本思路:一是入樣概率的建模推斷,可以考慮構建基于機器學習與變量選擇的傾向得分模型來估計入樣概率推斷總體;二是目標變量的建模推斷,可以考慮直接對目標變量建立參數、非參數或半參數超總體模型進行估計;三是入樣概率與目標變量的雙重建模推斷,可以考慮進行傾向得分模型與超總體模型的加權估計與混合推斷。最后,以基于廣義Boosted模型的入樣概率建模推斷為例演示了具體解決方法。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社