吉林大学学报(工学版) ›› 2012, Vol. 42 ›› Issue (02): 418-422.

• 论文 • 上一篇    下一篇

microRNA靶基因特征提取新方法

刘元宁1,2, 沈廷杰1,2, 张浩1,2, 李鑫1,2, 魏庆凯1,2, 赫羽喆1,2   

  1. 1. 吉林大学 计算机科学与技术学院, 长春 130012;
    2. 吉林大学 符号计算与知识工程教育部重点实验室, 长春 130012
  • 收稿日期:2011-03-19 出版日期:2012-03-01 发布日期:2012-03-01
  • 通讯作者: 张浩(1971-),男,副教授,博士.研究方向:生物信息学.E-mail:zhangh@jlu.edu.cn E-mail:zhangh@jlu.edu.cn
  • 作者简介:刘元宁(1962-),男,教授,博士.研究方向:生物信息学.E-mail:liuyn@jlu.edu.cn
  • 基金资助:

    国家自然科学基金项目(60971089).

New feature extraction methods of microRNA target genes

LIU Yuan-ning1,2, SHEN Ting-jie1,2, ZHANG Hao1,2, LI Xin1,2, WEI Qing-kai1,2, HE Yu-zhe1,2   

  1. 1. College of Computer Science and Technology, Jilin University, Changchun 130012, China;
    2. Symbol Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012, China
  • Received:2011-03-19 Online:2012-03-01 Published:2012-03-01

摘要: 针对microRNA靶基因预测中出现的敏感性与特异性的矛盾、阳性阈值与测试结果优劣的矛盾和预测范围缩小的问题,提出种子区域上的能量标定、元素比例、靶标作用体上的惩罚3种特征提取新方法,以上特征提取方法涵盖了统计信息、结构信息和能量信息。结合传统特征和新特征,本文利用神经网络构建分类模型并测试。结果显示:新特征能使阴性、阳性数据各自的聚集度有效提高,在高阳性阈值下,评估效果良好;并且靶基因预测范围未缩小,预测开销未增加。

关键词: 计算机应用, 生物信息学, 靶基因分类, 特征提取方法, 机器学习, 阳性靶基因阈值

Abstract: In microRNA gene targets prediction there are several problems, such as the contradiction between sensitivity and specificity, contradiction between masculine threshold and test results, and the narrowing of predict scope. To solve these problems, this article discusses three new kinds of feature extraction methods: energy calibration, element ratio in seed regions, and punishment in target binding structure. These feature extraction methods cover statistics, structure and energy information. Combing the traditional and the new features, we construct classification models and test them through neural network. The results show that the new methods gather positive data and negative data respectively as far as possible, and ensure a good evaluation under higher threshold. These methods are suitable for target genes prediction of various species without increase in spending.

Key words: computer application, bioinformatics, classification of target genes, feature extraction method, machine learning, threshold of positive target genes

中图分类号: 

  • TP399
[1] Finnegan E J, Matzke M A. The small RNA world[J]. Cell, 2003, 116(23): 4689-4693.

[2] Sethupathy P, Megraw M, Hatzigeorgiou A G. A guide through present computational approaches for the identification of mammalian microRNA targets[J]. Nature Methods, 2006, 3(11): 881-886.

[3] Xia W, Cao G J, Shao N S. Progress in miRNA target prediction and identification[J]. Sci China Ser C-Life Sci, 2009, 52(12): 1123-1130.

[4] Sturm Martin, Hackenberg Michael, Langenberger David, et al. TargetSpy: a supervised machine learning approach for microRNA target prediction[J]. BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-292.

[5] Miranda K C, Huynh T, Tay Y, et al. A pattern-based method for the identification of microRNA binding sites and their corresponding heteroduplexes[J]. Cell, 2006, 126: 1203-1217.

[6] Pei Y F, Wang X, Zhang X G. Predicting the fate of microRNA target genes based on sequence features[J]. Journal of Theoretical Biology, 2009, 261(1): 17-22.

[7] Maragkakis M, Alexiou P, Papadopoulos G L, et al. Accurate microRNA target prediction correlates with protein repression levels[J]. BMC Bioinformatics, 2009, doi:10.1186/1471-2105-10-295.

[8] Liu Hui, Yue Dong, Chen Yi-dong, et al. Improving performance of mammalian microRNA target prediction[J]. BMC Bioinformatics, 2010, doi:10.1186/1471-2105-11-476.

[9] 董浩, 刘元宁, 张浩, 等.马尔可夫链在RNA二级结构预测中的应用[J]. 吉林大学学报:工学版, 2010, 40(增刊):324-327. Dong Hao, Liu Yuan-ning, Zhang Hao, et al. Application of Markov chain in RNA secondary structure prediction[J]. Journal of Jinlin University(Engineering and Technology Edition), 2010, 40(Sup.): 324-327.
[1] 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850.
[2] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[3] 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866.
[4] 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872.
[5] 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878.
[6] 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570.
[7] 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599.
[8] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[9] 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613.
[10] 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628.
[11] 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223.
[12] 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230.
[13] 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236.
[14] 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243.
[15] 侯永宏, 王利伟, 邢家明. 基于HTTP的动态自适应流媒体传输算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1244-1253.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!