吉林大学学报(工学版)

• • 上一篇    下一篇

一种新的混合特征选择方法RRK

刘杰1,2,金弟1,2,杜惠君1,刘大有1,2   

  1. 1.吉林大学 计算机科学与技术学院, 长春 130012; 2.吉林大学 符号计算与知识工程教育部重点实验室, 长春 130012
  • 收稿日期:2007-10-30 修回日期:1900-01-01 出版日期:2009-03-01 发布日期:2009-03-01
  • 通讯作者: 刘大有

New hybrid feature selection method RRK

LIU Jie1,2,JIN Di1,2,DU Hui-jun1,LIU Da-you1,2   

  1. 1.College of Computer Science and Technology, Jilin University, Changchun 130012, China; 2.Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Changchun 130012, China
  • Received:2007-10-30 Revised:1900-01-01 Online:2009-03-01 Published:2009-03-01
  • Contact: LIU Da-you

摘要: 提出一种新的基于包装方法和过滤器方法的混合特征选择算法RRK。该算法主要包括两个方面:①在特征预选阶段,提出一种基于ReliefF算法的特征加权算法NReliefF和降维算法DR,以实现特征加权并去掉不太重要的特征;②在特征选择阶段,把NReliefF算法和KNN算法结合起来,将预选特征作为输入,用分类正确率来选择最优特征。分别采用一个实际的乘员类型数据集和UCI上的imagine标准数据集进行了实验。实验结果表明,采用RRK后分类的效率和正确率都有明显提高。

关键词: 人工智能, 特征选择, 包装方法, 过滤器方法, ReliefF算法

Abstract: Feature selection is one of the most important issues in system modeling, data mining and pattern recognition. A new hybrid feature selection method, named RRK, is proposed which is based on the wrapper and filter methods. This method includes two steps: (1) feature preselection phase, in this step an improved algorithm named NReliefF based on ReliefF and a dimension reduction algorithm named DR are given to finish featureweight and useless feature reduction; (2) feature selection phase, in this step the result of the feature preselection is used as the input, and the NReliefF and KNN algorithms are combined to select the optimal feature which is based on the highest accuracy rate. Both practical data sets of occupant type and standard data sets of Imagine in UCI are used to verify the proposed feature selection method. Results show that both the accuracy rate and efficiency of the classification are significantly improved by this method.

Key words: artificial intelligence, feature selection, wrapper method, filter method, ReliefF algorithm

中图分类号: 

  • TP301
[1] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[2] 顾海军, 田雅倩, 崔莹. 基于行为语言的智能交互代理[J]. 吉林大学学报(工学版), 2018, 48(5): 1578-1585.
[3] 王旭, 欧阳继红, 陈桂芬. 基于垂直维序列动态时间规整方法的图相似度度量[J]. 吉林大学学报(工学版), 2018, 48(4): 1199-1205.
[4] 张浩, 占萌苹, 郭刘香, 李誌, 刘元宁, 张春鹤, 常浩武, 王志强. 基于高通量数据的人体外源性植物miRNA跨界调控建模[J]. 吉林大学学报(工学版), 2018, 48(4): 1206-1213.
[5] 黄岚, 纪林影, 姚刚, 翟睿峰, 白天. 面向误诊提示的疾病-症状语义网构建[J]. 吉林大学学报(工学版), 2018, 48(3): 859-865.
[6] 李雄飞, 冯婷婷, 骆实, 张小利. 基于递归神经网络的自动作曲算法[J]. 吉林大学学报(工学版), 2018, 48(3): 866-873.
[7] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[8] 王旭, 欧阳继红, 陈桂芬. 基于多重序列所有公共子序列的启发式算法度量多图的相似度[J]. 吉林大学学报(工学版), 2018, 48(2): 526-532.
[9] 杨欣, 夏斯军, 刘冬雪, 费树岷, 胡银记. 跟踪-学习-检测框架下改进加速梯度的目标跟踪[J]. 吉林大学学报(工学版), 2018, 48(2): 533-538.
[10] 刘雪娟, 袁家斌, 许娟, 段博佳. 量子k-means算法[J]. 吉林大学学报(工学版), 2018, 48(2): 539-544.
[11] 曲慧雁, 赵伟, 秦爱红. 基于优化算子的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2017, 47(5): 1598-1603.
[12] 李嘉菲, 孙小玉. 基于谱分解的不确定数据聚类方法[J]. 吉林大学学报(工学版), 2017, 47(5): 1604-1611.
[13] 邵克勇, 陈丰, 王婷婷, 王季驰, 周立朋. 无平衡点分数阶混沌系统全状态自适应控制[J]. 吉林大学学报(工学版), 2017, 47(4): 1225-1230.
[14] 王生生, 王创峰, 谷方明. OPRA方向关系网络的时空推理[J]. 吉林大学学报(工学版), 2017, 47(4): 1238-1243.
[15] 马淼, 李贻斌. 基于多级图像序列和卷积神经网络的人体行为识别[J]. 吉林大学学报(工学版), 2017, 47(4): 1244-1252.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!