吉林大学学报(工学版) ›› 2016, Vol. 46 ›› Issue (4): 1209-1215.doi: 10.13229/j.cnki.jdxbgxb201604029
周炫余1, 刘娟1, 邵鹏1, 2, 罗飞1, 刘洋1
ZHOU Xuan-yu1, LIU Juan1, SHAO Peng1, 2, LUO Fei1, LIU Yang1
摘要: 针对现有的中文指代消解研究大多采用二元分类模型,容易出现消解正确率低的特征覆盖消解正确率高的特征以致模型指代划分错误的问题,提出了一种改进的层次过滤模型用于中文指代消解。该模型结合中文语义知识,在原模型中加入语义匹配层,该层通过引入Web语义知识很好地弥补了中文语义知识库较小的不足,并针对中文的特点对原模型的待消解项识别层进行相应的修改使之更加适合中文指代消解。将上述模型与两类基准系统在ACE2005中文语料上进行5种测评,结果表明,所提出模型的F平均值分别高于两类基准系统约4%和9%。
中图分类号:
[1] Hardmeier C,Federico M. Modelling pronominal anaphora in statistical machine translation[C]∥Proceedings of the International Workshop on Spoken Language Translation,Paris,2010:283-289. [2] Doddington G, Mitchell A, Przybocki M. The automatic content extraction (ACE) program-tasks, data,and evaluation[DB/OL].http:∥www.comp.nus.edu.sg/rpnlpir/proceedings/lrec-2004/pdf/.pdf, 2012-05-11. [3] Witte R, Krestel R, Bergler S. Context based mult- idocument summarization using fuzzy coreference cluster graphs[DB/OL].http:∥www. nlpir.nist.gov/projects/duc/pubs/2006.papers/20.final.pdf, 2012-05-06. [4] ning approach to coreference resolution of noun phr- ases[J].Computational Linguistics,2001(4): 521-544. [5] Raghunathan K, Lee H, Rangarajan S. A multipass sieve for coreference resolution[C]∥Massa-chusetts, MIT, 2010:492-501. [6] Lee H, Peirsman Y, Chang A, et al. Stanford's multi-pass sieve coreference resolution system at the CoNLL-2011 shared task[C]∥In Proceedings of the Fifteenth Conference on Computational Natural Language Learning:Shared Task,Oregon,2011:28-34. [7] Zhang Xiao-tian, Wu Chun-yang, Zhao Hai. Chinese coreference resolution via ordered filtering[C]∥In Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning: Shared Task, Jeju,2012:95-99. [8] 孔芳,朱巧明,周国栋,等.中英文指代消解中待消解项识别的研究[J].计算机研究与发展, 2012,49(5):1072-1085. Kong Fang, Zhu Qiao-ming, Zhou Guo-dong,et al.Anap-horicity determination for coreference resolution in English and Chinese[J]. Journal of Computer Research and Development, 2012,49(5):1072-1085. [9] 刘群,李素建.基于《知网》的词汇语义相似度计算[EB/OL].[2015-02-14]http:∥www.keenage.com,2013. [10] Cilibrasi R L, Vitanyi P M. The google similarity distance[J].IEEE Transactions on Knowledge and Data Engineering,2007, 19(3): 370-383. [11] Marc Vilain, John Burger, John Aberdeen,et al. A model theoretic coreference scoring scheme[C]∥In Proceedings of the 6th Message Understanding Conference,Stroudsburg,1995:45-52. [12] Amit Bagga, Breck Baldwin. Algorithms for scoring coreference chains[C]∥In Proceedings of LREC,Granada,1998:563-566. [13] Luo Xiao-qiang. On coreference resolution performance metrics[C]∥In Proceedings of HLT- EMNLP,Stroudsburg,2005:25-32. [14] Ghosh.Handbook of Data Mining[M].Cleveland CRC Press,2001:247-277. [15] Marta Recasens,Eduard Hovy.BLANC: Implementing the Rand Index for coreference evalu-ation[J].Natural Language Engineering,2011,17(4):485-510. |
[1] | 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577. |
[2] | 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585. |
[3] | 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205. |
[4] | 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213. |
[5] | 黄岚, 纪林影, 姚刚, 翟睿峰, 白天. 面向误诊提示的疾病-症状语义网构建[J]. 吉林大学学报(工学版), 2018, 48(3): 859-865. |
[6] | 李雄飞, 冯婷婷, 骆实, 张小利. 基于递归神经网络的自动作曲算法[J]. 吉林大学学报(工学版), 2018, 48(3): 866-873. |
[7] | 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881. |
[8] | 王旭, 欧阳继红, 陈桂芬. 基于多重序列所有公共子序列的启发式算法度量多图的相似度[J]. 吉林大学学报(工学版), 2018, 48(2): 526-532. |
[9] | 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538. |
[10] | 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544. |
[11] | 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603. |
[12] | 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611. |
[13] | 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230. |
[14] | 王生生, 王创峰, 谷方明. OPRA方向关系网络的时空推理[J]. 吉林大学学报(工学版), 2017, 47(4): 1238-1243. |
[15] | 马淼, 李贻斌. 基于多级图像序列和卷积神经网络的人体行为识别[J]. 吉林大学学报(工学版), 2017, 47(4): 1244-1252. |
|