吉林大学学报(工学版) ›› 2011, Vol. 41 ›› Issue (4): 1071-1076.

• 论文 • 上一篇    下一篇

基于DNA微阵列数据的特征子空间集成分类

于化龙1,2,顾国昌1,赵靖1,刘海波1,沈晶1   

  1. 1.哈尔滨工程大学 计算机科学与技术学院|哈尔滨 150001;2.江苏科技大学|计算机科学与工程学院|江苏 镇江|212003
  • 收稿日期:2009-11-14 出版日期:2011-07-01 发布日期:2011-07-01
  • 通讯作者: 顾国昌(1946-),男,教授,博士生导师.研究方向:图像处理,模式识别,智能机器人. E-mail:guguochang@hrbeu.edu.cn
  • 作者简介:于化龙(1982-)|男|博士研究生.研究方向:模式识别|生物信息学.E-mail:yuhualong@hrbeu.edu.cn
  • 基金资助:

    国家自然科学基金项目(60873036);中国博士后科学基金项目(20060400809);黑龙江省青年科学技术专项基金项目(QC06C022);中央高校基本科研业务费专项项目(HEUCF100601, HEUCFT1007).

Feature subspace ensemble classification based on DNA microarray data

YU Hua-long1,2, GU Guo-chang1, ZHAO Jing1, LIU Hai-bo1, SHEN Jing1   

  1. 1.College of Computer Science and Technology, Harbin Engineering University, Harbin 150001, China;2.School
    of Computer Science and Engineering, Jiangsu University of Science and Technology, Zhenjiang 212003, China
  • Received:2009-11-14 Online:2011-07-01 Published:2011-07-01

摘要:

针对DNA微阵列数据应用于临床诊断时分类准确率过低的问题,结合其高维小样本的特点提出了一种特征子空间集成分类方法。该方法首先通过层次聚类与信噪比特征选择策略将原始训练数据集映射到一个非冗余的特征基因空间,然后随机抽取一些特征子空间构成训练子集并应用支持向量机训练基分类器,最后采用多数投票的方式决定测试样本的类属。最后在4个标准的微阵列数据集上与其他方法进行了对比实验,结果证明了本文方法的有效性。

关键词: 计算机应用, 集成分类, 特征子空间, DNA微阵列数据, 支持向量机

Abstract:

Low classification accuracy is one of the major restrictions to the use of microarray data in clinical diagnosis. To solve this problem, by taking consideration of the characteristics of high-dimension and small sample of DNA microarray dataset, a novel classification approach was proposed, which is named feature subspace ensemble classification. In this approach, first, hierarchical clustering and signal-noise ratio feature selection strategy were used to project the training dataset from original space to a non-redundant feature gene space. Then, mass feature subspaces were extracted to construct training subsets, and support vector machine was used to train base classifiers. Finally, the majority voting strategy was applied to classify the testing samples. The effectiveness and feasibility of the proposed approach was verified on four benchmark microarray datasets. Experiment results show that better classification performance can be obtained by the proposed approach than majority of the current ensemble classification approaches on microarray data.

Key words: computer application, ensemble classification, feature subspace, DNA microarray data, support vector machine

中图分类号: 

  • TP391
[1] 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850.
[2] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[3] 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866.
[4] 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872.
[5] 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878.
[6] 隗海林, 包翠竹, 李洪雪, 李明达. 基于最小二乘支持向量机的怠速时间预测[J]. 吉林大学学报(工学版), 2018, 48(5): 1360-1365.
[7] 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570.
[8] 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599.
[9] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[10] 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613.
[11] 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628.
[12] 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223.
[13] 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230.
[14] 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236.
[15] 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!