吉林大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (增刊1): 382-386.

• 论文 • 上一篇    下一篇

软件缺陷因素挖掘

涂威威, 黎铭, 周志华   

  1. 南京大学 计算机软件新技术国家重点实验室, 南京 210046
  • 收稿日期:2012-06-05 出版日期:2012-09-01 发布日期:2012-09-01
  • 通讯作者: 黎铭(1980-),男,副教授.研究方向:软件挖掘,机器学习.E-mail:lim@lamda.nju.edu.cn E-mail:lim@lamda.nju.edu.cn
  • 作者简介:涂威威(1987-),男,硕士研究生.研究方向:机器学习,软件挖掘.E-mail:tuww@lamda.nju.edu.cn
  • 基金资助:

    国家自然科学基金项目(60903103,61021062,61272217),国家电网公司科技项目(EPRIXXK[2012]2918).

Mining software defect factor

TU Wei-wei, LI Ming, ZHOU Zhi-hua   

  1. National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210046, China
  • Received:2012-06-05 Online:2012-09-01 Published:2012-09-01

摘要: 利用软件开发过程各个阶段中多方面的信息,构建了排序支持向量机(RankSVM)和支持向量回归(SVR)软件缺陷密度预测模型。实验结果表明,与支持向量回归软件缺陷密度预测模型相比,排序支持向量机软件缺陷密度预测模型能够更好地反映软件开发过程中多方面因素对软件缺陷密度的影响。通过对排序支持向量机软件缺陷密度预测模型的分析找出影响软件缺陷密度的重要因素,可以指导后续实践。

关键词: 计算机软件, 软件挖掘, 机器学习, 软件缺陷

Abstract: The information about various aspects of the software development was used to build the ranking support vector machine(RankSVM) model and support vector regression(SVR) model for software defect density. Experimental results show that RankSVM software defect density prediction model performs better than SVR software defect density prediction model. By analyzing the RankSVM model, the important influence factors of software defect density are found to guide software development.

Key words: computer software, software mining, machine learning, software defect

中图分类号: 

  • TP181
[1] Basili V R, Briand L C, Melo W L. A validation of object-oriented design metrics as quality indicators[J]. IEEE Transactions on Software Engineering, 1996, 22(10):751-761.

[2] Khoshgoftaar T M, Allen E B, Jones W D, et al. Classification-tree models of software-quality over multiple releases[J]. IEEE Transactions on Reliability, 2000, 49(1):4-11.

[3] Fenton N E , Neil M. A critique of software defect prediction models[J]. IEEE Transactions Software Engineering, 1999, 25(5):675-689.

[4] Goldman S, Zhou Y. Enhancing supervised learning with unlabeled data[C]//Proceedings of the 17th International Conference on Machine Learning, San Francisco, CA, 2000: 327-334.

[5] Fenton N E, Neil M, Marsh W, et al. On the effectiveness of early life cycle defect prediction with Bayesian Nets[J]. Empirical Software Engineering, 2008, 13(5):499-537.

[6] Hastie T, Tibshirani R, Friedman J. The Elements of Statistical Learning: Data Mining, Inference, and Prediction(Springer Series in Statistics, Ed. 2)[M]. New York : Springer-Verlag, 2009.

[7] Chang Y W, Lin C J. Feature ranking using linear SVM[J]. Journal of Machine Learning Research, 2008, 3: 53-64.

[8] Chapelle O, Keerthi S. Efficient algorithms for ranking with SVMs[J]. Information Retrieval Journal, 2010, 13(3): 201-215.

[9] MODIST: Models of Uncertainty and Risk for Distributed Software Development[Z]. EC Information Society Technologies Project IST-2000-28749. www.modist.org

[10] Giger E, Pinzger M , Gall H. Comparing fine-grained source code changes and code churn for bug prediction[C]//Proceeding of the 8th Working Conference on Mining Software Repositories, ACM, New York, NY, USA , 2011: 83-92.
[1] 马健, 樊建平, 刘峰, 李红辉. 面向对象软件系统演化模型[J]. 吉林大学学报(工学版), 2018, 48(2): 545-550.
[2] 罗养霞, 郭晔. 基于数据依赖特征的软件识别[J]. 吉林大学学报(工学版), 2017, 47(6): 1894-1902.
[3] 赵东, 臧雪柏, 赵宏伟. 基于果蝇优化的随机森林预测方法[J]. 吉林大学学报(工学版), 2017, 47(2): 609-614.
[4] 应欢, 王东辉, 武成岗, 王喆, 唐博文, 李建军. 适用于商用系统环境的低开销确定性重放技术[J]. 吉林大学学报(工学版), 2017, 47(1): 208-217.
[5] 李勇, 黄志球, 王勇, 房丙午. 基于多源数据的跨项目软件缺陷预测[J]. 吉林大学学报(工学版), 2016, 46(6): 2034-2041.
[6] 王念滨, 祝官文, 周连科, 王红卫. 支持高效路径查询的数据空间索引方法[J]. 吉林大学学报(工学版), 2016, 46(3): 911-916.
[7] 特日跟, 江晟, 李雄飞, 李军. 基于整数数据的文档压缩编码方案[J]. 吉林大学学报(工学版), 2016, 46(1): 228-234.
[8] 康辉, 王家琦, 梅芳. 基于Pi演算的并行编程语言[J]. 吉林大学学报(工学版), 2016, 46(1): 235-241.
[9] 陈鹏飞, 田地, 杨光. 基于MVC架构的LIBS软件设计与实现[J]. 吉林大学学报(工学版), 2016, 46(1): 242-245.
[10] 刘磊, 王燕燕, 申春, 李玉祥, 刘雷. Bellman-Ford算法性能可移植的GPU并行优化[J]. 吉林大学学报(工学版), 2015, 45(5): 1559-1564.
[11] 冯晓宁, 王卓, 张旭. 基于L-π演算的WSN路由协议形式化方法[J]. 吉林大学学报(工学版), 2015, 45(5): 1565-1571.
[12] 李明哲, 王劲林, 陈晓, 陈君. 基于网络处理器的流媒体应用架构模型(VPL)[J]. 吉林大学学报(工学版), 2015, 45(5): 1572-1580.
[13] 王克朝, 王甜甜, 苏小红, 马培军. 基于频繁闭合序列模式挖掘的学生程序雷同检测[J]. 吉林大学学报(工学版), 2015, 45(4): 1260-1265.
[14] 黄宏涛,王静,叶海智,黄少滨. 基于惰性切片的线性时态逻辑性质验证[J]. 吉林大学学报(工学版), 2015, 45(1): 245-251.
[15] 范大娟1, 2, 黄志球1, 肖芳雄1, 祝义1, 王进1. 面向多服务交互的相容性分析与适配器生成[J]. 吉林大学学报(工学版), 2014, 44(4): 1094-1103.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!