摘要:
为解决微阵列数据中因样本量少且每个样本的维度高而带有大量干扰信息和冗余信息的问题, 通过分阶段的步骤对特征基因集进行全方位的选取和优化。考虑到单个基因在不同环境中的差异性, 从中选择出只在特定条件下差异较大的基因构成候选特征集; 剔除候选特征集中相关性较小的基因; 采用遗传算法对所得特征集的任意子集的整体分类性能进行考查, 选出较优的子集。实验结果表明, 该算法对逐步选取特征基因具有可行性和有效性, 而特征基因集在分类适应度(分类能力度量)和分类准确率均比原始数据更好。
中图分类号:
问亮军, 郑虹. 多阶段的微阵列数据特征基因集选取[J]. 吉林大学学报(信息科学版), 2014, 32(5): 550-555.
WEN Liangjun, ZHENG Hong. Multi-Stages Informative Gene Set Selection Algorithm in Microarray Expression Profiles[J]. Journal of Jilin University(Information Science Ed, 2014, 32(5): 550-555.