J4 ›› 2009, Vol. 27 ›› Issue (04): 418-.

• 论文 • 上一篇    下一篇

基于基因表达式编程的代价敏感分类算法

吴 江1 |李太勇1,2| 刘洋洋1|唐常杰2
  

  1. 1. 西南财经大学 经济信息工程学院,成都 610074;2. 四川大学 计算机学院,成都610065
  • 出版日期:2009-07-20 发布日期:2009-08-27
  • 通讯作者: 吴江(1980— ),男,浙江衢州人, 西南财经大学博士研究生,讲师,主要从事数据挖掘研究, E-mail:wujiang@cs.scu.edu.cn
  • 作者简介:吴江(1980— )|男|浙江衢州人| 西南财经大学博士研究生|讲师|主要从事数据挖掘研究,(Tel)86-13880950851 (E-mail)wujiang@cs.scu.edu.cn;唐常杰(1946— )|男|重庆人| 四川大学教授|博士生导师|主要从事数据挖掘研究|(Tel)86-28-85466105 (E-mail)tangchangjie@cs.scu.edu.cn
  • 基金资助:

    四川省青年软件创新工程基金资助项目(2007aa028)

Cost-Sensitive Classification Algorithm Based on Gene Expression Programming

WU Jiang1, LI Tai-yong1,2, LIU Yang-yang1|TANG Chang-jie2   

  1. 1. School of Economic Information Engineering, Southwest University of Finance and Economics, Chengdu 610074,China;2.School of Computer Science, Sichuan University, Chengdu 610065, China
  • Online:2009-07-20 Published:2009-08-27

摘要:

  针对传统分类算法在稀有类上的分类效果不佳,通过引进代价矩阵,改进了基因表达式编程的适应度函数,提出了一种基于基因表达式编程的代价敏感分类 (CSC-GEP:Cost-Sensitive Classification-Gene Expression Programming) 算法,并在UCI数据集上对该算法进行了实验。实验结果表明,CSC-GEP的召回率、精度和F-度量值较C4.5分类器分别提高了7.07%,2.89%,5.12%,证明了CSC-GEP是一种有效的代价敏感分类算法。

关键词: 分类, 代价敏感, 稀有类, 基因表达式编程

Abstract:

To improve the classification precision of rare class problem, by importing cost matrix and fitness function of GEP (Gene Expression Programming), we propose a  CSC-GEP(Cost-Sensitive Classification-Gene Expression Programming) . The experiments carried on benchmark datasets from the UCI machine learning repository show that CSC-GEP is effective. CSC-GEP increases the recall rate, precision and F-measure by 7.07%, 2.89%, and 5.12% respectively compared with C4.5.

Key words: classification, cost-sensitive, rare classes, gene expression programming

中图分类号: 

  • TP18