吉林大学学报(工学版) ›› 2015, Vol. 45 ›› Issue (2): 576-582.doi: 10.13229/j.cnki.jdxbgxb201502035

• 论文 • 上一篇    下一篇

基于SVM的网络数据无监督特征选择算法

代琨1,2,于宏毅1,仇文博2,李青1   

  1. 1.解放军信息工程大学 信息系统工程学院, 郑州 450002;
    2.空军大连通信士官学校 无线电导航系,辽宁 大连 116600
  • 收稿日期:2013-06-25 出版日期:2015-04-01 发布日期:2015-04-01
  • 作者简介:代琨(1982),男,博士研究生.研究方向:模式识别,数据挖掘.E-mail:daikun_1223@163.com
  • 基金资助:
    国家科技重大专项项目(2010ZX03006-002,2011ZX03005-003-03).

Unsupervised feature selection algorithm based on support vector machine for network data

DAI Kun1,2, YU Hong-yi1, QIU Wen-bo2,LI Qing1   

  1. 1.Information System Engineering Institute, PLA Information Engineering University, Zhengzhou 450002, China;
    2.Department of Radio Navigation,Dalian Airforce Communication NCO Academy,Dalian 116600,China
  • Received:2013-06-25 Online:2015-04-01 Published:2015-04-01

摘要: 面向线性不可分的未知格式网络数据,提出了一种基于支持向量机的无监督特征选择算法。该算法通过非线性映射函数将不可分的网络数据映射到高维空间中,然后在高维空间中进行无监督的特征选择。该算法在特征选择之前不需要人工构造候选特征集合,直接从原始网络数据中自动地选择关键特征。利用人工数据集和网络数据集进行的实验结果表明:本文算法在特征选择可行性和有效性方面都有良好的表现。

Abstract: Focusing on non-linear separable network data with unknown specification, an unsupervised feature selection algorithm based on Support Vector Machine (SVM) was proposed, termed UFSSVM. The proposed algorithm first maps the non-linear network data into a high dimensional feature space using a non-linear mapping function; then it performs unsupervised feature selection in the high dimensional feature space. Compared with traditional unsupervised feature selection algorithms, the proposed algorithm can automatically get the relevant features just using the original network packet without the preprocessing step to get the original feature set. The performance of the proposed algorithm is examined by simulations and with real network data set. Experiment results illustrate the feasibility and effectiveness of the proposed algorithm in feature subset selection.

中图分类号: 

  • TP301
[1] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[2] 董飒, 刘大有, 欧阳若川, 朱允刚, 李丽娜. 引入二阶马尔可夫假设的逻辑回归异质性网络分类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1571-1577.
[3] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[4] 王占中, 卢月, 刘晓峰, 赵利英. 基于改进和声搜索算法的越库车辆排序[J]. 吉林大学学报(工学版), 2018, 48(3): 688-693.
[5] 刘杰, 张平, 高万夫. 基于条件相关的特征选择方法[J]. 吉林大学学报(工学版), 2018, 48(3): 874-881.
[6] 赵宏伟, 刘宇琦, 特日根, 陈长征, 臧雪柏. 基于有限序列的压缩新算法[J]. 吉林大学学报(工学版), 2018, 48(3): 882-886.
[7] 底晓强, 王英政, 李锦青, 从立钢, 祁晖. 基于量子细胞神经网络超混沌的视频加密方法[J]. 吉林大学学报(工学版), 2018, 48(3): 919-928.
[8] 王艺源, 欧阳丹彤, 张立明. 结合部件动态变化度求解最小碰集的GRASP算法[J]. 吉林大学学报(工学版), 2017, 47(3): 930-936.
[9] 黄岚, 李玉, 王贵参, 王岩. 基于点距离和密度峰值聚类的社区发现方法[J]. 吉林大学学报(工学版), 2016, 46(6): 2042-2051.
[10] 王贵参, 黄岚, 王岩, 宋立明, 欧歌. 引入极值非相邻连接的连接聚类方法[J]. 吉林大学学报(工学版), 2016, 46(5): 1616-1621.
[11] 王涛, 张乾, 李占山, 张良. 基于成功回溯的约束推理技术[J]. 吉林大学学报(工学版), 2016, 46(5): 1622-1626.
[12] 车翔玖, 梁森. 一种基于大顶堆的SPIHT改进算法[J]. 吉林大学学报(工学版), 2016, 46(3): 865-869.
[13] 董立岩, 隋鹏, 孙鹏, 李永丽. 基于半监督学习的朴素贝叶斯分类新算法[J]. 吉林大学学报(工学版), 2016, 46(3): 884-889.
[14] 董飒, 刘大有, 李丽娜, 欧阳若川, 柴晓丽. 基于类传播分布的关系近邻异质性网络分类方法[J]. 吉林大学学报(工学版), 2016, 46(2): 522-527.
[15] 赵伟, 曲慧雁. 基于云计算Map-Reduce模型的快速碰撞检测算法[J]. 吉林大学学报(工学版), 2016, 46(2): 578-584.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!