摘要:自然語言處理技術已用于非結構化中文電子病歷信息抽取,并且新的算法或模型不斷出現(xiàn),但其應用效果的證據(jù)較少。共收集北京某大型三甲綜合醫(yī)院呼吸專科住院電子病歷38218份,通過對數(shù)據(jù)預處理,抽象文本特征與定義語法規(guī)則,產(chǎn)生訓練數(shù)據(jù)集和測試集,構建層疊條件隨機場模型,并評估該模型的識別效果。結果表明,針對入院記錄、出院記錄、輔助檢查報告3大類共39種非結構化文本,該模型可準確、快速地處理病歷文本信息,應用效果較為理想。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社