›› 2012, Vol. 42 ›› Issue (04): 947-951.

• 论文 • 上一篇    下一篇

基于支持向量数据描述的P2P流量识别

刘三民1,2, 孙知信1,3,4   

  1. 1. 南京航空航天大学 计算机科学与技术学院, 南京 210016;
    2. 安徽工程大学 计算机与信息学院, 安徽 芜湖 241000;
    3. 南京邮电大学 计算机技术研究所, 南京 210003;
    4. 南京大学 计算机软件新技术国家重点实验室, 南京 210093
  • 收稿日期:2011-02-24 出版日期:2012-07-01 发布日期:2012-07-01
  • 通讯作者: 孙知信(1964-),男,教授,博士生导师.研究方向:计算机网络与安全.E-mail:sunzx@njupt.edu.cn E-mail:sunzx@njupt.edu.cn
  • 基金资助:
    国家自然科学基金项目(60973140); 江苏省自然科学基金项目(BK2009425); 江苏省高校自然科学基础研究项目(08KJB520005).

P2P traffic identification based on support vector data description

LIU San-min1,2, SUN Zhi-xin1,3,4   

  1. 1. College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China;
    2. College of Computer and Information, Anhui Polytechnic University, Wuhu 241000, China;
    3. College of Computer, Nanjing University of Posts and Telecommunications, Nanjing 210003, China;
    4. State Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210093, China
  • Received:2011-02-24 Online:2012-07-01 Published:2012-07-01

摘要: 借鉴聚类思想引入基于支持向量数据描述(SVDD)的原理,建立P2P流量识别模型。该模型首先用主成分分析法(PCA)对训练集降维,然后用SVDD方法寻找包含大部分样本最小超球,保留各自支持向量样本点作为识别模型;然后计算测试样本距各球心距离,距离近者为其所属类别。该模型简单,适合P2P流量识别环境,克服了现有基于机器学习的流量识别方法在多类分类中模型复杂、数据不平衡等缺点。实验结果表明,该模型具有较高的分类精度和可靠性。

关键词: 计算机系统结构, 支持向量数据描述, 主成分分析, P2P流量识别

Abstract: In light of the idea of clustering, the model of P2P traffic identification was constructed by Support Vector Data Description (SVDD). First, Principal Component Analysis (PCA) was introduced to reduce dimensions of the data set. Then, the classified model was established by support vector samples, which come from the minimal sphere by the principle of SVDD. Finally, the class of the test samples was determined by the minimal distance between the center of sphere and the sample. The model is simple and suitable for P2P traffic identification environment. It overcomes the shortcoming of the current research based on machine learning in model complexity and data unbalance. Experiment results show the high accuracy and reliability of the proposed model.

Key words: computer system organization, support vector data description, principal component analysis, P2P traffic identification

中图分类号: 

  • TP393
[1] Zuev D, Moore A W. Traffic classification using a statistical approach//Proc of the PAM, LNCS 3431, Heidelberg:Springer-Verlag, 2005:321-324.
[2] Moore A W, Zuev D. Internet traffic classification using Bayesian analysis techniques//Proc of the ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems, 2005:50-60.
[3] Tom Auld, Moore A W, Stephen F G. Bayesian neural networks for internet traffic classification[J]. IEEE Transactions on Neural Networks, 2007, 18(1):223-239.
[4] Erman J,Mahanti A,Arlitt M.Internet traffic identification using machine learning techniques//Proc of the 49th IEEE GLOBECOM, San Francisco, 2006.
[5] Alice Este, Francesco Gringoli, Luca Salgarelli. Support vector machines for TCP traffic classification[J]. Computer Networks, 2009, 53:2476-2490.
[6] 孙知信, 张玉峰. 基于多维支持向量机的P2P网络流量识别模型[J]. 吉林大学学报:工学版, 2010, 40(5):1298-1302. Sun Zhi-xin,Zhang Yu-feng.P2P network traffic identification model based on MSVM[J]. Journal of Jilin University (Engineering and Technology Edition), 2010, 40(5):1298-1302.
[7] Tax D, Duin R P. Support vector domain description[J]. Pattern Recognition Letters, 1999, 20:1191-1199.
[8] Tax D, Duin R P. Support vector data description[J]. Machine Learning, 2004, 54(1):45-66.
[9] Moore A W, Zuev D, Crogan M. Discriminators for use in flow-based classification, RR-05-13. London:Queen Mary University of London, 2005.
[1] 余宜诚, 胡亮, 迟令, 初剑峰. 一种改进的适用于多服务器架构的匿名认证协议[J]. 吉林大学学报(工学版), 2018, 48(5): 1586-1592.
[2] 刘哲, 徐涛, 宋余庆, 徐春艳. 基于NSCT变换和相似信息鲁棒主成分分析模型的图像融合技术[J]. 吉林大学学报(工学版), 2018, 48(5): 1614-1620.
[3] 张曼, 施树明. 典型汽车运行工况的状态转移特征分析[J]. 吉林大学学报(工学版), 2018, 48(4): 1008-1015.
[4] 耿庆田, 于繁华, 王宇婷, 高琦坤. 基于特征融合的车型检测新算法[J]. 吉林大学学报(工学版), 2018, 48(3): 929-935.
[5] 董坚峰, 张玉峰, 戴志强. 改进的基于狄利克雷混合模型的推荐算法[J]. 吉林大学学报(工学版), 2018, 48(2): 596-604.
[6] 赵博, 秦贵和, 赵永哲, 杨文迪. 基于半陷门单向函数的公钥密码[J]. 吉林大学学报(工学版), 2018, 48(1): 259-267.
[7] 刘磊, 刘利娟, 吴新维, 张鹏. 基于ECPMR的编译器测试方法[J]. 吉林大学学报(工学版), 2017, 47(4): 1262-1267.
[8] 董立岩, 王越群, 贺嘉楠, 孙铭会, 李永丽. 基于时间衰减的协同过滤推荐算法[J]. 吉林大学学报(工学版), 2017, 47(4): 1268-1272.
[9] 于斌斌, 武欣雨, 初剑峰, 胡亮. 基于群密钥协商的无线传感器网络签名协议[J]. 吉林大学学报(工学版), 2017, 47(3): 924-929.
[10] 邓昌义, 郭锐锋, 张忆文, 王鸿亮. 基于平衡因子的动态偶发任务低功耗调度算法[J]. 吉林大学学报(工学版), 2017, 47(2): 591-600.
[11] 魏晓辉, 刘智亮, 庄园, 李洪亮, 李翔. 支持大规模流数据在线处理的自适应检查点机制[J]. 吉林大学学报(工学版), 2017, 47(1): 199-207.
[12] 郝娉婷, 胡亮, 姜婧妍, 车喜龙. 基于多管理节点的乐观锁协议[J]. 吉林大学学报(工学版), 2017, 47(1): 227-234.
[13] 苏畅, 付黎明, 魏君, 李硕, 黄蕾, 曹越. 基于感性工学和主成分分析的车身色彩设计[J]. 吉林大学学报(工学版), 2016, 46(5): 1414-1419.
[14] 魏晓辉, 李翔, 李洪亮, 李聪, 庄园, 于洪梅. 支持大规模流数据处理的弹性在线MapReduce模型及拓扑协议[J]. 吉林大学学报(工学版), 2016, 46(4): 1222-1231.
[15] 车翔玖, 梁森. 一种基于大顶堆的SPIHT改进算法[J]. 吉林大学学报(工学版), 2016, 46(3): 865-869.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!