摘要:目的當前生物文獻挖掘工作的重心是改進各挖掘模塊性能,以提升挖掘結果的可信度,但有很大比例的挖掘結果其文獻證據很少,為此本文提出一個利用Bing搜索引擎從海量Web數據中為文獻挖掘得到的生物實體關聯對提供補充證據的工具系統。方法利用現有文本挖掘技術從PubMed文獻中挖掘一批生物實體關聯對,引入BingWeb搜索模塊,以生物實體名作為關鍵詞從Web中利用Bing開放搜索API得到一批搜索結果,將這些結果整理成新的數據源,最終從該新的數據源中挖掘得到一批來自Web的補充證據。結果本系統(bioinfo.ustc.edu.cn/NetRD)對文獻證據較少的生物實體關聯對提供了有效的補充證據支持,豐富了文獻挖掘結果最終的證據集。結論以Web數據作為補充數據源,能夠有效地為文獻證據很少的生物實體對提供證據補充,為相關研究者確認兩個生物實體之間的關聯提供重要參考。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社