吉林大学学报(工学版) ›› 2014, Vol. 44 ›› Issue (2): 459-464.doi: 10.13229/j.cnki.jdxbgxb201402029

• 论文 • 上一篇    下一篇

基于相关向量机的在线网络流量分类方法

夏靖波, 柏骏, 赵小欢, 吴吉祥   

  1. 空军工程大学 信息与导航学院, 西安 710077
  • 收稿日期:2012-11-08 出版日期:2014-02-01 发布日期:2014-02-01
  • 通讯作者: 柏骏(1985- ),男,博士研究生.研究方向:网络管理与信息安全.E-mail:peking1985-2005@163.com E-mail:peking1985-2005@163.com
  • 作者简介:夏靖波(1963- ),男,教授,博士生导师.研究方向:通信网络管理与评估.E-mail:jbxiad@sina.com
  • 基金资助:

    陕西省科技计划自然基金重点项目(2012JZ8005);全军军事学研究生课题项目.

Online network traffic classification using relevant vector machine

XIA Jing-bo, BAI Jun, ZHAO Xiao-huan, WU Ji-xiang   

  1. Information and Navigation College, Air Force Engineering University, Xi'an 710077, China
  • Received:2012-11-08 Online:2014-02-01 Published:2014-02-01

摘要:

在研究、分析分类结果预测概率及其对分类准确率影响的基础上,提出了一种新的基于相关向量机(RVM)的在线网络流量分类方法:首先,利用RVM对网络流量分类,输出分类结果预测概率;对于置疑区间[0.1,0.9]内的网络流,采用"端口号+深度数据包检测(DPI)"相结合的方法重新进行识别;对于预测概率处于[0,0.1]和[0.9,1]区间的分类结果则完全采纳。实验表明:该方法的整体分类准确率能达到98%左右,且实时性较好。

关键词: 计算机应用, 流量分类, 相关向量机, 流量特征, 置疑区间

Abstract:

Based on the research and analysis of probabilistic classification and its influence on the overall accuracy,a new online traffic classification method is proposed. First,the Relevant Vector Machine (RVM) is used to classify traffic flows and output probabilistic classification.Then,the flows, whose classification probability is in doubting interval[0.1,0.9],are re-identified by using port & Deep Packet Inspection (DPI).If the predicted probability is in the interval [0,0.1] and [0.9,1],the classification is totally accepted.Experiment studies demonstrate that the proposed method can reach the overall accuracy of 98%,and perform well in online network traffic classification.

Key words: computer application, traffic classification, relevant vector machine, traffic features, douting interval

中图分类号: 

  • TP393

[1] Internet Assigned Numbers Authority (IANA)[EB/OL].[2010-08-28]. http://www.iana.org/assignments/port-numbers

[2] Moore A W, Papagiannaki D. Toward the accurate Identification of network applications[C]//Poc 6th Passive Active Measurement. Workshop (PAM), Boston, MA, USA, 2005.

[3] Sen S, Spatscheck O, Wand D. Accurate, scalable in-network identification of P2P traffic using application signatures[C]//Proceedings of the 13th International World Wide Web Conference on Alternate Track Papers & Posters (WWW'04). New York, USA: ACM, 2004.

[4] Karagiannis T, Papagiannaki K, Faloutsos M. BLINC: multilevel traffic classification in the dark[C]//ACM SIGCOMM. Phila-delphia, PA, USA, 2005.

[5] Dainotti A, Pescape A, Sansone C. Issues and future directions in traffic classification[J]. IEEE Network, 2012, 26(1):35-40.

[6] Gu Cheng-jie, Zhang Shun-yi, Sun Yan-fei. Real-time encrypted traffic identification using machine learning[J].Journal of Software, 2011, 6(6):1009-1016.

[7] 孙知信, 张玉峰. 基于多维支持向量机的P2P网络流量识别模型[J]. 吉林大学学报:工学版, 2010, 40(5): 1298-1302. Sun Zhi-xin, Zhang Yu-feng. P2P network traffic identification model based on MSVM[J]. Journal of Jilin University (Engineering and Technology Edition), 2010, 40(5): 1298-1302.

[8] Tipping M. Sparse Bayesian learning and the relevance vector machine[J]. Journal of Machine Learning Research, 2001, 1(1): 211-244.

[9] 杨成福, 章毅. 相关向量机及在说话人识别应用中的研究[J]. 电子科技大学学报, 2010, 39(2):311-315. Yang Cheng-fu, Zhang Yi. Study to speaker recognition using RVM[J]. Journal of Electronic Science and Technology, 2010, 39(2):311-315.

[10] Mianji F A, Zhang Y. Robust hyperspectral classification using relevance vector machine[J]. Geoscience and Remote Sensing, 2011, 49(6):2100-2112.

[11] Moore A W, Zuev D. Internet traffic classification using Bayesian analysis techniques[C]//Proc of the 2005 ACM SIGMETRICS Int'l Conf. on Measurement and Modeling of Computer Systems, Banff, 2005.

[12] Moore A W, Zuev D. Discriminators for use in flow-based classification[R]. Technical Report, Intel Research, Cambridge, 2005.

[13] NetMate[EB/OL].[2012-07-03].http:[C]//sourceforge.net/projects/netmate-meter/.

[14] Bernaille L, Teixeira R, Akodkenou I, et al.Traffic classification on the fly[J].ACM SIGCOMM Computer Communication Review, 2006, 36(2):23-26.

[1] 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850.
[2] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[3] 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866.
[4] 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872.
[5] 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878.
[6] 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570.
[7] 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599.
[8] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[9] 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613.
[10] 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628.
[11] 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223.
[12] 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230.
[13] 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236.
[14] 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243.
[15] 侯永宏, 王利伟, 邢家明. 基于HTTP的动态自适应流媒体传输算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1244-1253.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!