吉林大学学报(工学版) ›› 2018, Vol. 48 ›› Issue (2): 526-532.doi: 10.13229/j.cnki.jdxbgxb20170302

• • 上一篇    下一篇

基于多重序列所有公共子序列的启发式算法度量多图的相似度

王旭1, 2, 欧阳继红1, 2, 陈桂芬3   

  1. 1.吉林大学 计算机科学与技术学院,长春130012;
    2.吉林大学 符号计算与知识工程教育部重点实验室,长春130012;
    3.吉林农业大学 信息技术学院,长春 130118
  • 收稿日期:2017-03-30 出版日期:2018-03-01 发布日期:2018-03-01
  • 通讯作者: 欧阳继红(1964-),女,教授,博士生导师. 研究方向:数据挖掘,时空推理. E-mail:ouyj@jlu.edu.cn
  • 作者简介:王旭(1982-),男,博士研究生. 研究方向:数据挖掘,图挖掘. E-mail:75014557@qq.com
  • 基金资助:
    国家自然科学基金项目(61472157,61602204,6152198)

Heuristic algorithm of all common subsequences of multiple sequences for measuring multiple graphs similarity

WANG Xu1, 2, OUYANG Ji-hong1, 2, CHEN Gui-fen3   

  1. 1.College of Computer Science and Technology, Jilin University, Changchun 130012, China;
    2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China;
    3.College of Information Technology, Jilin Agricultural University, Changchun 130118, China
  • Received:2017-03-30 Online:2018-03-01 Published:2018-03-01

摘要: 提出了启发式A*算法度量任意多个图的相似度方法,该算法将多图表示多重序列,在多重序列的匹配点上计算多重序列的所有公共子序列数,得到的所有公共子序列数用来度量多图的相似度。该算法避免了在非匹配点上的冗余计算,最大化后缀序列的所有公共子序列数的启发函数值,将访问的节点限制在两个序列匹配的子集,减少了计算节点的个数。与现有度量图的相似度方法相比,该算法不仅可以度量任意多个图的相似度,而且计算过程简单,通过启发信息的引导能够快速地度量多图的相似度。

关键词: 人工智能, 多图相似度, 启发式算法, 所有公共子序列, 多重序列, 匹配

Abstract: A heuristic algorithm A* for measuring the similarity of multiple graphs is proposed. In this algorithm, the multiple graphs are represented as multiple sequences, then the number of all common subsequences in the matches of the multiple graphs is calculated, and this number is used to measure the similarity of the multiple graphs. This algorithm avoids the redundant calculations in non-matches of multiple graphs, maximizes the heuristic function value of all common subsequences of the suffixes sequences, limits the search nodes to the subset of matches between two sequences, thus reducing the number of the calculation nodes. Compared with the existing graph similarity methods, the proposed algorithm can not only measure the similarity of multiple graphs, but also simplify the calculation process. The similarity of multiple graphs can be quickly measured using this algorithm with the boot of the heuristic information.

Key words: artificial intelligence, multiple graph similarity, heuristic algorithm, all common subsequences, multiple sequences, matches

中图分类号: 

  • TP18
[1] Hattori M, Okuno Y, Goto S, et al. Development of a chemical structure comparison method for integrated analysis of chemical and genomic information in the metabolic pathways [J]. Journal of the American Chemical Society, 2003, 125(39): 11853-11865.
[2] Shanavas N, Wang H, Lin Z, et al. Supervised graph-based term weighting scheme for effective Text Classification [C] ∥ Proceedings of the 22nd European Conference on Artificial Intelligence, Hague, Netherlands, 2016: 1710-1711.
[3] Elzinga C, Wang H. Kernels for acyclic digraphs [J]. Pattern Recognition Letters, 2012, 33(16): 2239-2244.
[4] Sugiyama M, Llinares F, Kasenburg N, et al. Significant subgraph mining with multiple testing correction [C] ∥ Proceedings of the SIAM International Conference on Data Mining, Vancouver, Canada, 2015: 37-45.
[5] Li Tao, Dong Han, Shi Yong-tang, et al. A comparative analysis of new graph distance measures and graph edit distance [J]. Information Sciences, 2017, 403: 15-21.
[6] Zhu Gang-gao, Iglesias C. Computing semantic similarity of concepts in knowledge graphs [J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(1): 72-85.
[7] Sugiyama M, Borgwardt K. Halting in random walk Kernels [C]∥28th International Conference on Neural Information Processing Systems,Montreal, Canada, 2015: 1639-1647.
[8] Borgwardt K, Kriegel H. Shortest-path Kernels on graphs [C]∥Proceedings of IEEE International Conference on Data Mining, Houston, USA, 2005: 74-81.
[9] Szilagyi S, Szilagyi L. A fast hierarchical clustering algorithm for large-scale protein sequence data sets [J]. Computers in Biology and Medicine, 2014, 48: 94-101.
[10] Forster D, Bittner L, Karkar S, et al. Testing ecological theories with sequence similarity networks: marine ciliates exhibit similar geographic dispersal patterns as multicellular organisms [J]. BMC Biology, 2015,13(1):1-16.
[11] Yanardag P, Vishwanathan S. A structural smoothing framework for robust graph comparison [C]∥Proceedings of Neural Information Processing Systems, Montreal, Canada, 2015: 2134-2142.
[12] Wang H. All common subsequences [C]∥Proceeding 20th International Joint Conference on Artificial Intelligence, Hyderabad, India, 2007: 635-640.
[13] Lin Z, Wang H, McClean S. A multidimensional sequence approach to measuring tree similarity [J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(2): 197-208.
[14] Chin F, Poon C.Performance analysis of some simple heuristics for computing longest common subsequences [J]. Algorithmica, 1994, 12: 293-311.
[15] Wang Q, Korkin D, Shang Y. A fast multiple longest common subsequence(MLCS) algorithm [J]. IEEE Transactions on Knowledge and Data Engineering, 2011, 23(3): 321-334.
[1] 何仁,杨柳,胡东海. 冷藏运输车太阳能辅助供电制冷系统设计及分析[J]. 吉林大学学报(工学版), 2018, 48(6): 1645-1652.
[2] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[3] 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585.
[4] 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205.
[5] 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213.
[6] 黄岚, 纪林影, 姚刚, 翟睿峰, 白天. 面向误诊提示的疾病-症状语义网构建[J]. 吉林大学学报(工学版), 2018, 48(3): 859-865.
[7] 李雄飞, 冯婷婷, 骆实, 张小利. 基于递归神经网络的自动作曲算法[J]. 吉林大学学报(工学版), 2018, 48(3): 866-873.
[8] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[9] 杨东升, 张展, 廉梦佳, 王丽娜. 位图局部敏感哈希的匹配二进制特征搜索算法[J]. 吉林大学学报(工学版), 2018, 48(3): 893-902.
[10] 焦玉玲, 徐良成, 王占中, 张鹏. 基于有向网络的双U型装配线平衡实验与分析[J]. 吉林大学学报(工学版), 2018, 48(2): 454-459.
[11] 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538.
[12] 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544.
[13] 李娟, 孟可心, 李月, 刘慧力. 基于相似匹配维纳滤波的地震资料噪声压制[J]. 吉林大学学报(工学版), 2017, 47(6): 1964-1968.
[14] 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603.
[15] 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
[1] 王文权, 商延赓, 李秀娟, 王春生, 张桂兰. 激光焊接650 MPa相变诱发塑性钢的组织与性能[J]. , 2012, 42(05): 1203 -1207 .
[2] 黄健康1, 何翠翠1, 2, 石玗1, 樊丁1. 铝/钢异种金属焊接接头界面Al-Fe金属间化合物生成及其热力学分析[J]. 吉林大学学报(工学版), 2014, 44(4): 1037 -1041 .
[3] 徐涛, 刘光洁, 葛海潮, 张炜, 于征磊. 焊接热源局部坐标移动曲线路径建模方法[J]. 吉林大学学报(工学版), 2014, 44(6): 1704 -1709 .
[4] 骆海涛, 周维佳, 王洪光, 武加锋. 搅拌摩擦焊机器人典型工况下的受载分析[J]. 吉林大学学报(工学版), 2015, 45(3): 884 -891 .
[5] 杨悦, 周磊磊. 微弧氧化对铝合金搅拌摩擦焊缝耐蚀性能的影响[J]. 吉林大学学报(工学版), 2016, 46(2): 511 -515 .
[6] 初亮, 孙成伟, 郭建华, 赵迪, 李文惠. 基于轮缸压力的制动能量回收评价方法[J]. 吉林大学学报(工学版), 2018, 48(2): 349 -354 .
[7] 何祥坤, 季学武, 杨恺明, 武健, 刘亚辉. 基于集成式线控液压制动系统的轮胎滑移率控制[J]. 吉林大学学报(工学版), 2018, 48(2): 364 -372 .
[8] 张天时, 宋东鉴, 高青, 王国华, 闫振敏, 宋薇. 电动汽车动力电池液体冷却系统构建及其工作过程仿真[J]. 吉林大学学报(工学版), 2018, 48(2): 387 -397 .
[9] 袁朝春, 张龙飞, 陈龙, 何友国, 范兴根. 基于路面辨识的主动避撞系统制动性能[J]. 吉林大学学报(工学版), 2018, 48(2): 407 -414 .
[10] 徐洪峰, 高霜霜, 郑启明, 章琨. 信号控制交叉口的复合动态车道管理方法[J]. 吉林大学学报(工学版), 2018, 48(2): 430 -439 .