摘要:【目的】比較不同機器學習算法在智能分診任務中的準確率,針對性地分析在線問診平臺的類目設置問題,嘗試從數據中提取新特征提升分類器效果。【方法】基于“春雨醫生”13個科室33 073條實際問診數據,比較兩種文本向量化方式在支持向量機、多項式貝葉斯、Logistic回歸、隨機森林、k近鄰以及集成分類模型這6種分類器上實現智能分診的準確率;通過高頻詞分析及詞語共現對不同科室的錯分數據進一步分析。【結果】文本向量化方法為TF-IDF、分類算法為支持向量機的分類器在智能分診中的總體效果最優,增加年齡和性別特征后分類準確率可達76.3%。該分類器對外科數據分診準確率僅為40.9%,原因在于問診平臺類目設置的混淆。【局限】假設現有數據中患者選擇的科室是正確的。【結論】機器學習可用于在線問診平臺的智能分診任務,根據醫療數據特點增加輸入特征是分類器提高準確率的一個方向。部分疾病及癥狀的跨科室性影響了分類器的效果,在線問診平臺可通過推薦多個科室的方式來提升患者問診體驗。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社