吉林大学学报(工学版) ›› 2013, Vol. 43 ›› Issue (02): 424-428.

• 论文 • 上一篇    下一篇

基于典型相关分析的复杂网络模块挖掘算法

叶育鑫1,2, 赵建民3, 莫毓昌3, 欧阳丹彤1,2, 刘华文2,3   

  1. 1. 吉林大学 计算机科学与技术学院, 长春 130012;
    2. 吉林大学 符号计算与知识工程教育部重点实验室, 长春 130012;
    3. 浙江师范大学 数理与信息工程学院, 浙江 金华 321004
  • 收稿日期:2012-05-05 出版日期:2013-03-01 发布日期:2013-03-01
  • 通讯作者: 刘华文(1977-),男,讲师.研究方向:数据挖掘,机器学习.E-mail:hwliu@zjnu.edu.cn E-mail:hwliu@zjnu.edu.cn
  • 作者简介:叶育鑫(1981-),男,讲师.研究方向:数据挖掘,语义Web.E-mail:yeyx@jlu.edu.cn
  • 基金资助:

    国家自然科学基金项目(60973089,61170314,41172294,61100119,60903011);浙江省自然科学基金项目(Y1100689);浙江师范大学计算机软件与理论省级重中之重学科开放基金项目(ZSDZZZZXK10,ZSDZZZZXK05);吉林大学符号计算与知识工程教育部重点实验室开放项目(93K-17-2009-K05,93K-17-2010-K02).

CCA-based mining algorithm of modules in in complex networks

YE Yu-xin1,2, ZHAO Jian-min3, MO Yu-chang3, OUYANG Dan-tong1,2, LIU Hua-wen2,3   

  1. 1. College of Computer Science and Technology, Jilin University, Changchun 130012, China;
    2. Key Lab of Symbol Computation and Knowledge Engineer of Ministry of Education, Jilin University, Changchun 130012, China;
    3. College of Mathematics, Physics and Information Engineering, Zhejiang Normal University, Jinhua 321004, China
  • Received:2012-05-05 Online:2013-03-01 Published:2013-03-01

摘要: 利用典型相关分析(CCA)分析了复杂网络中的功能模块及其相互关系,并将其转化为LASSO回归优化问题,提高了结果的可解释性。在此基础上,提出了一种模块及其相互关系的挖掘算法。该算法不仅能准确挖掘网络中的功能模块,而且还能同时度量模块之间的相关程度。人工生成数据集和DBLP数据集上的模拟实验表明,提出的算法能准确地挖掘网络中的功能模块及其相关性。

关键词: 计算机软件, 复杂网络, 功能模块, 社交网络分析, 典型相关分析

Abstract: Complex networks, such as social networks and biological networks, are ubiquitous in real world. Identifying modules and their relationships in complex networks is very important to discover entities and modules behind the networks, and to understand the mechanisms of the networks. In this paper, we analyze modules and their interplays in complex network using Canonical Correlation Analysis (CCA). To improve the interpretability of the results, we further extend the solution of CCA as a LASSO optimization problem, and then propose a new mining algorithm of modules and their relationships. This algorithm enables us to disclose modules and explicitly modeling their relationships simultaneously. Extensive experiments on both synthetic and DBLP datasets demonstrate the effectiveness of the proposed method.

Key words: computer software, complex network, functional module, social network, canonical correlation analysis (CCA)

中图分类号: 

  • TP31
[1] Palla G, Barabási A-L, Vicsek T. Quantifying social group evolution[J]. Nature, 2007, 446(7136): 664-667.

[2] Liu B, Liu L, Tsykin A, et al. Identifying functional miRNA-mRNA regulatory modules with correspondence latent dirichlet allocation[J]. Bioinformatics, 2010,26(24):3105-3011.

[3] Scott J. Social Network Analysis: A Handbook[M]. London, UK: SAGE Publications, 2000.

[4] Getoor L, Diehl C P. Link mining: a survey[J]. SIGKDD Explor Newsl,2005, 7:3-12.

[5] Fortunato S. Community detection in graphs[J]. Phy Rept, 2010, 486(3):75-174.

[6] Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Phys Rev E, 2004, 69(2):026113.

[7] Negoescu R-A, Gatica-Perez D. Modeling flickr communities through probabilistic topic-based analysis[J]. IEEE Trans Mult, 2010, 12(5): 399-416.

[8] Hotelling H. Relations between two sets of variables[J]. Biometrika, 1936, 28(3/4):312-377.

[9] Tibshirani R. Regression shrinkage and selection via the lasso: a retrospective[J]. J R Statist Soc B, 2011, 73(3):273-282.
[1] 马健, 樊建平, 刘峰, 李红辉. 面向对象软件系统演化模型[J]. 吉林大学学报(工学版), 2018, 48(2): 545-550.
[2] 罗养霞, 郭晔. 基于数据依赖特征的软件识别[J]. 吉林大学学报(工学版), 2017, 47(6): 1894-1902.
[3] 应欢, 王东辉, 武成岗, 王喆, 唐博文, 李建军. 适用于商用系统环境的低开销确定性重放技术[J]. 吉林大学学报(工学版), 2017, 47(1): 208-217.
[4] 时小虎, 冯国香, 李牧, 李瑛, 吴春国. 基于密度峰值的重叠社区发现算法[J]. 吉林大学学报(工学版), 2017, 47(1): 242-248.
[5] 李勇, 黄志球, 王勇, 房丙午. 基于多源数据的跨项目软件缺陷预测[J]. 吉林大学学报(工学版), 2016, 46(6): 2034-2041.
[6] 黄岚, 李玉, 王贵参, 王岩. 基于点距离和密度峰值聚类的社区发现方法[J]. 吉林大学学报(工学版), 2016, 46(6): 2042-2051.
[7] 郭玉泉, 李雄飞. 复杂网络社区的分形聚类检测方法[J]. 吉林大学学报(工学版), 2016, 46(5): 1633-1638.
[8] 王念滨, 祝官文, 周连科, 王红卫. 支持高效路径查询的数据空间索引方法[J]. 吉林大学学报(工学版), 2016, 46(3): 911-916.
[9] 特日跟, 江晟, 李雄飞, 李军. 基于整数数据的文档压缩编码方案[J]. 吉林大学学报(工学版), 2016, 46(1): 228-234.
[10] 康辉, 王家琦, 梅芳. 基于Pi演算的并行编程语言[J]. 吉林大学学报(工学版), 2016, 46(1): 235-241.
[11] 陈鹏飞, 田地, 杨光. 基于MVC架构的LIBS软件设计与实现[J]. 吉林大学学报(工学版), 2016, 46(1): 242-245.
[12] 刘磊, 王燕燕, 申春, 李玉祥, 刘雷. Bellman-Ford算法性能可移植的GPU并行优化[J]. 吉林大学学报(工学版), 2015, 45(5): 1559-1564.
[13] 冯晓宁, 王卓, 张旭. 基于L-π演算的WSN路由协议形式化方法[J]. 吉林大学学报(工学版), 2015, 45(5): 1565-1571.
[14] 李明哲, 王劲林, 陈晓, 陈君. 基于网络处理器的流媒体应用架构模型(VPL)[J]. 吉林大学学报(工学版), 2015, 45(5): 1572-1580.
[15] 王克朝, 王甜甜, 苏小红, 马培军. 基于频繁闭合序列模式挖掘的学生程序雷同检测[J]. 吉林大学学报(工学版), 2015, 45(4): 1260-1265.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!