吉林大学学报(工学版) ›› 2018, Vol. 48 ›› Issue (5): 1563-1570.doi: 10.13229/j.cnki.jdxbgxb20170744
欧阳丹彤1,2, 范琪1,2
OUYANG Dan-tong1,2, FAN Qi1,2
摘要: 针对开放信息抽取文本中与事实相关的语境信息,本文首先从原有语境标识中提取特征进行训练分类,扩展了可识别的语境标识;其次,利用文本中依存关系,自顶向下逐层将识别出的语境信息与被限定子句构造成层次结构图,并最终根据层次图为被限定子句中抽取出的关系元组自底向上地分配对应语境域,从而一方面避免了语境信息被错误的抽取为关系元组,另一方面在保证关系元组正确的基础上,正确地将语境域分配给被限定的关系元组。实验结果验证了子句级别语境感知的抽取方法ClauseContextIE,在随机数据与含语境信息的文本中,实现了较高的召回率和精确度。
中图分类号:
[1] Banko M, Cafarella M J, Soderland S, et al.Open information extraction from the web[C]∥Proceeding of the 20th IJCAI. Hyderabad: Morgan Kaufmann Publishers, 2007:2670-2676. [2] Wu F, Weld D S.Open information extraction using Wikipedia[C]∥Proceedings of the 48th ACL. Uppsala:ACL, 2010:118-127. [3] Fader A, Soderland S, Etzioni O.Identifying relations for open information extraction[C]∥Proceedings of the 2011 Conference on EMNLP. Edinburgh: ACL, 2011:1535-1545. [4] Schmitz M, Bart R, Soderland S, et al.Open language learning for information extraction[C]∥Proceedings of the 2012 Conference on EMNLP. Jeju Island: ACL, 2012:523-534. [5] Akbik A, Ser A.Krake [6] del Corro L, Gemulla R. Clausie: clause-based open information extraction[C]∥Proceedings of the 22nd International Conference on World Wide Web.Rio de Janeiro: ACM, 2013:355-366. [7] Hoffart J, Suchanek F M, Berberich K, et al.Yago2:a spatially and temporally enhanced knowledge base from Wikipedia[J]. Artificial Intelligence, 2013, 194: 28-61. [8] Tseng Y H, Lee L H, Lin S Y,et al.Chinese open relation extraction for knowledge acquisition[C]∥Proceedings of the 14th Conference of the European Chapter of the ACL. Gothenburg: ACL, 2014:12-16. [9] Qiu L, Zhang Y.ZORE:a syntax-based system for Chinese open relation extraction[C]∥Proceedings of the 2014 Conference on EMNLP. Doha: ACL, 2014:1870-1880. [10] 秦兵, 刘安安, 刘挺. 无指导的中文开放式实体关系抽取[J]. 计算机研究与发展, 2015, 52(5): 1029-1035. Qin Bing, Liu An-an, Liu Ting.Unsupervised Chinese open entity relation extraction[J].Journal of Computer Research and Development, 2015, 52(5): 1029-1035. [11] 邹博伟, 钱忠, 陈站成, 等. 面向自然语言文本的否定性与不确定性信息抽取[J]. 软件学报, 2016, 27(2): 309-328. Zou Bo-wei, Qian Zhong, Chen Zhan-cheng, et al.Negation and uncertainty information extraction oriented to natural language text[J].Journal of Software, 2016, 27(2):309-328. [12] 周炫余, 刘娟, 邵鹏, 等. 基于层次过滤模型的中文指代消解[J]. 吉林大学学报:工学版, 2016, 46(4): 1209-1215. Zhou Xuan-yu, Liu Juan, Shao Peng, et al.Chinese anaphora resolution based on multi-pass sieve model[J]. Journal of Jilin University (Engineering and Technology Edition), 2016, 46(4): 1209-1215. [13] Klein D, Manning C D.Accurate unlexicalized parsing[C]∥Proceedings of the 41st ACL. Sapporo: ACL, 2003:423-430. [14] Quirk R, Greenbaum S, Leech G, et al.A Comprehensive Grammar of the English Language[M]. London: Longman, 1985:13-16. [15] Schuler K K.Verbnet: a broad-coverage, comprehensive verb lexicon[D]. Philadelphia: University of Pennsylvania, 2005. [16] Pennington J, Socher R, Manning C.Glove: Global vectors for word representation[C]∥Proceedings of the 2014 Conference on EMNLP. Doha: ACL, 2014: 1532-1543. [17] Sandhaus E.The New York Times annotated corpus[R]. Philadelphia: Linguistic Data Consortium, 2008. |
[1] | 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850. |
[2] | 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858. |
[3] | 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866. |
[4] | 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872. |
[5] | 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878. |
[6] | 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599. |
[7] | 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605. |
[8] | 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613. |
[9] | 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628. |
[10] | 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223. |
[11] | 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230. |
[12] | 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236. |
[13] | 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243. |
[14] | 侯永宏, 王利伟, 邢家明. 基于HTTP的动态自适应流媒体传输算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1244-1253. |
[15] | 赵宏伟, 刘宇琦, 特日根, 陈长征, 臧雪柏. 基于有限序列的压缩新算法[J]. 吉林大学学报(工学版), 2018, 48(3): 882-886. |
|