吉林大学学报(工学版) ›› 2018, Vol. 48 ›› Issue (3): 859-865.doi: 10.13229/j.cnki.jdxbgxb20170406

• 论文 • 上一篇    下一篇

面向误诊提示的疾病-症状语义网构建

黄岚1,2, 纪林影3, 姚刚4, 翟睿峰5, 白天1,2   

  1. 1.吉林大学 计算机科学与技术学院,长春 130012;
    2.吉林大学 符号计算与知识工程教育部重点实验室,长春 130012;
    3.吉林大学 软件学院,长春 130012;
    4.吉林大学第二医院 神经内科,长春 130041;
    5.长春理工大学 电子信息工程学院,长春 130022;
  • 收稿日期:2017-04-21 出版日期:2018-05-20 发布日期:2018-05-20
  • 通讯作者: 白天(1983-),男,副教授,博士.研究方向:生物信息学.E-mail:baitian@jlu.edu.cn
  • 作者简介:黄岚(1974-),女,教授,博士生导师.研究方向:社区发现,数据挖掘,商务智能.E-mail:huanglan@jlu.edu.cn
  • 基金资助:
    国家自然科学基金项目(61472159,61702214,61572227); 吉林省重点科技攻关项目(20160204022GX, 20170101006JC, 20170203002GX,20150520064JH); 吉林省产业创新专项项目(2017C030-1,2017C033); 中国博士后科学基金面上项目(2014M561293); 珠海市优势学科项目; 广东省优势重点学科建设项目.

Construction of disease-symptom semantic net for misdiagnosis prompt

HUANG Lan1,2, JI Lin-ying3, YAO Gang4, ZHAI Rui-feng5, BAI Tian1,2   

  1. 1.College of Computer Science and Technology,Jilin University,Changchun 130012,China;
    2.Key Laboratory of Symbol Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012,China;
    3.College of Software,Jilin University,Changchun 130012,China;
    4.Neurological Department,The Second Hospital of Jilin University,Changchun 130041,China;
    5.College of Electronical and Information Engineering,Changchun University of Science and Technology,Changchun 130022,China
  • Received:2017-04-21 Online:2018-05-20 Published:2018-05-20

摘要: 首先,从医疗语料库中识别症状描述词语,基于症状间语义关系构建症状本体。然后,通过文本挖掘抽取疾病与症状间的关系、疾病与疾病间的易误诊关系,建立疾病-症状语义网DSSN。DSSN中包含了疾病本体DO、新构建的症状本体、疾病间的易误诊关系及鉴别诊断知识。最后,通过一个临床诊断中的用例来说明DSSN在临床辅助诊断系统中对易误诊提示的帮助。

关键词: 人工智能, 语义网, 文本挖掘, 误诊, 本体

Abstract: A Disease-Symptom Semantic Net (DSSN) for misdiagnosis prompt is constructed. First, symptom words are recognized from medical corpus, and a symptom ontology based on semantic relations between symptom words is established. Then, the relations between diseases and symptoms and the misdiagnosed relations between diseases were test mined and extracted to construct DSSN. DSSN contains Disease Ontology (DO), new established symptom ontology, misdiagnosed relations between diseases and differential diagnosis knowledge. Finally, a use case in clinical diagnosis is used to illustrate that DSSN is helpful to prompt misdiagnosis in clinical assistance diagnosis system.

Key words: artificial intelligence, semantic network, text mining, misdiagnosis, ontology

中图分类号: 

  • TP182
[1] Balogh E P, Miller B T, Ball J R, et al.Improving diagnosis in healthcare[R]. Washington, DC:The National Academies Press,2015.
[2] 赵会懂. 通过误诊文献的关键词词频分析看临床误诊发生的规律[J]. 中国医学图书情报杂志,2010,19(11):73-77.
Zhao Hui-dong.Clinical misdiagnosis rules found in analysis of the frequencies of its key words appeared in misdiagnosis related papers[J]. Chinese Journal of Medical Library and Information Science,2010,19(11):73-77.
[3] Ely J W, Graber M L, Croskerry P.Checklists to reduce diagnostic errors[J]. Academic Medicine,2011,86(3):307-313.
[4] 王俊华,左万利,彭涛. 面向文本的本体学习方法[J]. 吉林大学学报:工学版,2015,45(1):237-244.
Wang Jun-hua, Zuo Wan-li, Peng Tao.Test-orinted ontology learning methods[J]. Journal of Jilin University(Engineering and Technology Edition),2015,45(1):237-244.
[5] Gene O C.The gene ontology (GO) database and informatics resource[J]. Nucleic Acids Research,2004,32(Database):D258-D261.
[6] Schriml L M, Arze C, Nadendla S, et al.Disease ontology: a backbone for disease semantic integration[J]. Nucleic Acids Research,2012,40(Database):D940-D946.
[7] Kohler S, Doelken S C, Mungall C J, et al.The human phenotype ontology project: linking molecular biology and disease through phenotype data[J]. Nucleic Acids Research,2014,42(Database):D966-D974.
[8] 刘彦斌,周春光,张重毅,等. 基于本体的语义生物信息数据库资源链接[J]. 吉林大学学报:工学版,2010,40(6):1651-1654.
Liu Yan-bin, Zhou Chun-guang,Zhang Chong-yi, et al.Resource interlinking of semantic bioinformatics database based on ontology[J]. Journal of Jilin University(Engineering and Technology Edition),2010,40(6):1651-1654.
[9] Mohammed O, Benlamri R, Fong S.Building a diseases symptoms ontology for medical diagnosis: an integrative approach[C]∥Proc of the IEEE International Conference on Future Generation Communication Technology,London,2012:104-108.
[10] Cheng L,Wang G H, Li J,et al.SIDD:a semantically integrated database towards a global view of human disease[J]. Plos One,2013,8(10):e75504.
[11] Huang Lan, Wang Ye, Wang Yan, et al.Gene-disease interaction retrieval from multiple sources: a network based method[J]. Biomed Research International,2016,2016(3):3594517.
[12] Bai Tian, Gong Lei-guang, Wang Ye, et al.A method for exploring implicit concept relatedness in biomedical knowledge network[J]. BMC Bioinformatics,2016,17(9):53-66.
[13] Jonquet C, Shah N H, Youn C H, et al.NCBO annotator: semantic annotation of biomedical data[C]∥Proc of the 8th Int Semantic Web Conf, Poster and Demonstration Session, Berlin,2009:2-3.
[14] Demner-Fushman D, Rogers W J, Aronson A R.MetaMap lite: an evaluation of a new Java implementation of MetaMap[J]. Journal of the American Medical Informatics Association,2017,24(4):841-844.
[15] Porter M F.An algorithm for suffix stripping[J]. Program Electronic Library & Information Systems,2006,14(3):130-137.
[16] Miller G A, Fellbaum C.WordNet then and now[J]. Language Resources and Evaluation,2007,41(2):209-214.
[17] Lawrence Tierney, Saint Sanjay, Whooley Mary.Current Essentials of Medicine[M].4th ed. New York:McGraw-Hill Companies,2011.
[18] Gennari J H, Musen M A, Fergerson R W, et al.The evolution of Protégé:an environment for knowledge based systems development[J]. International Journal of Human-Computer Studies,2009,58(1):89-123.
[19] 孙宝志. 临床医学导论[M].北京:高等教育出版社,2013.
[1] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[2] 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585.
[3] 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205.
[4] 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213.
[5] 李雄飞, 冯婷婷, 骆实, 张小利. 基于递归神经网络的自动作曲算法[J]. 吉林大学学报(工学版), 2018, 48(3): 866-873.
[6] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[7] 王旭, 欧阳继红, 陈桂芬. 基于多重序列所有公共子序列的启发式算法度量多图的相似度[J]. 吉林大学学报(工学版), 2018, 48(2): 526-532.
[8] 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538.
[9] 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544.
[10] 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603.
[11] 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611.
[12] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
[13] 王生生, 王创峰, 谷方明. OPRA方向关系网络的时空推理[J]. 吉林大学学报(工学版), 2017, 47(4): 1238-1243.
[14] 马淼, 李贻斌. 基于多级图像序列和卷积神经网络的人体行为识别[J]. 吉林大学学报(工学版), 2017, 47(4): 1244-1252.
[15] 周炳海, 彭涛. 混流装配线准时化物料配送调度优化[J]. 吉林大学学报(工学版), 2017, 47(4): 1253-1261.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 郭孔辉;王爽;丁海涛;张建伟 . 后悬架非对称式橡胶衬套弹性耦合特性[J]. 吉林大学学报(工学版), 2007, 37(06): 1225 -1228 .
[2] 刘松山, 王庆年, 王伟华, 林鑫. 惯性质量对馈能悬架阻尼特性和幅频特性的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 557 -563 .
[3] 初亮, 王彦波, 祁富伟, 张永生. 用于制动压力精确控制的进液阀控制方法[J]. 吉林大学学报(工学版), 2013, 43(03): 564 -570 .
[4] 李静, 王子涵, 余春贤, 韩佐悦, 孙博华. 硬件在环试验台整车状态跟随控制系统设计[J]. 吉林大学学报(工学版), 2013, 43(03): 577 -583 .
[5] 胡兴军, 李腾飞, 王靖宇, 杨博, 郭鹏, 廖磊. 尾板对重型载货汽车尾部流场的影响[J]. 吉林大学学报(工学版), 2013, 43(03): 595 -601 .
[6] 王同建, 陈晋市, 赵锋, 赵庆波, 刘昕晖, 袁华山. 全液压转向系统机液联合仿真及试验[J]. 吉林大学学报(工学版), 2013, 43(03): 607 -612 .
[7] 张春勤, 姜桂艳, 吴正言. 机动车出行者出发时间选择的影响因素[J]. 吉林大学学报(工学版), 2013, 43(03): 626 -632 .
[8] 马万经, 谢涵洲. 双停车线进口道主、预信号配时协调控制模型[J]. 吉林大学学报(工学版), 2013, 43(03): 633 -639 .
[9] 于德新, 仝倩, 杨兆升, 高鹏. 重大灾害条件下应急交通疏散时间预测模型[J]. 吉林大学学报(工学版), 2013, 43(03): 654 -658 .
[10] 肖赟, 雷俊卿, 张坤, 李忠三. 多级变幅疲劳荷载下预应力混凝土梁刚度退化[J]. 吉林大学学报(工学版), 2013, 43(03): 665 -670 .