摘要:【目的】針對自然語言處理中查詢主題漂移和詞不匹配問題,提出一種基于加權關聯模式挖掘和規則后件擴展的跨語言信息檢索模型及其算法。【方法】該模型采用新的加權關聯模式支持度和基于最大項目權值的項集剪枝策略挖掘頻繁項集,利用置信度和相關度評價加權關聯規則,根據擴展模型從規則中提取優質擴展詞實現規則后件擴展,擴展詞與原查詢詞項組合為新查詢再次檢索文檔得到最終檢索結果。【結果】實驗結果表明,與單語言檢索基準比較,本文檢索模型的R-prec和P@10平均增幅分別為42.49%和25.53%;與跨語言檢索基準比較,其平均增幅分別為91.87%和64.61%;與現有基于加權關聯規則挖掘的跨語言檢索方法比較,R-prec和P@10最高平均增幅分別可達93.20%和34.60%。【局限】只進行實驗性研究,需要探討在實際跨語言搜索引擎中的具體應用。【結論】本文檢索模型能有效地減少查詢主題漂移和詞不匹配問題,改善和提高檢索性能。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社