吉林大学学报(工学版) ›› 2015, Vol. 45 ›› Issue (2): 613-618.doi: 10.13229/j.cnki.jdxbgxb201502041

• 论文 • 上一篇    下一篇

基于局部结构交互的RNA假结预测

刘元宁1,2,艾露露1,2,段云娜1,2,李誌3,田明尧4,张浩1,2   

  1. 1.吉林大学 计算机科学与技术学院,长春 130012;
    2.吉林大学 符号计算与知识工程教育部重点实验室,长春 130012;
    3.长春理工大学 应用技术学院,长春 130022;
    4.军事医学科学院 军事兽医研究所,长春130122
  • 收稿日期:2013-05-19 出版日期:2015-04-01 发布日期:2015-04-01
  • 通讯作者: 张浩(1971),男,副教授,博士.研究方向:生物信息学.E-mail:zhangh@jlu.edu.cn
  • 作者简介:刘元宁(1962),男,教授,博士生导师.研究方向:生物信息学.E-mail:liuyn@jlu.edu.cn
  • 基金资助:
    国家自然科学基金项目(60971089).

RNA pseudoknot prediction based on local structure interaction

LIU Yuan-ning1,2, AI Lu-lu1,2,DUAN Yun-na1,2,LI Zhi3,TIAN Ming-yao4,ZHANG Hao1,2   

  1. 1.College of Computer Science and Technology, Jilin University, Changchun 130012, China;
    2.Symbol Computation and Knowledge Engineering of Ministry of Education,Jilin University,Changchun 130012,China;
    3.College of Applied Technique, Changchun University of Science and Technology, Changchun 130022, China;
    4.Military Veterinary Institute, Academy of Military Medical Science, Changchun 130122,China
  • Received:2013-05-19 Online:2015-04-01 Published:2015-04-01

摘要: 基于RNA局部结构间的交互作用,提出一种含假结的RNA二级结构预测新方法LIFold。对给定的RNA序列,首先通过能量计算得到不含假结的能量最优结构,然后应用局部结构交互配对生成假结茎区,在已得到的最优结构基础上构建含假结的能量计算模型,最后通过优化算法得到含假结的RNA二级结构。应用该方法基于HotKnots测试数据的敏感性和阳性预测值(PPV)分别达到84%和80%,基于PseudoBase数据库测试数据的敏感性和阳性预测值分别达到78%和73%,与HotKnots、ILM、PknotsRG、IPknot 及FlexStem等知名软件相比较,准确率均有所提高。

关键词: 计算机应用, RNA二级结构, 假结, 最小自由能, 交互配对

Abstract: According to the interaction between local structures of RNA, a new algorithm, named LIFold, is presented to predict RNA secondary structure with pseudoknot. For a given RNA sequence, first, the optimal RNA secondary structure without pseudoknot is generated based on the method of free energy calculation. Then, the pseudoknot stems are obtained using local structure pairing interaction, and an energy calculation model with pseudoknot is established on the basis of the optimal structure. Finally, the RNA secondary structure with pseudoknot is obtained using optimization algorithm. Using the test data of HotKnots, the sensitivity and Positive Predict Value (PPV) reach 84% and 80% respectively. Using the test data based on PseudoBase database, the sensitivity and PPV reach 78% and 73% respectively. Comparing to HotKnots, ILM, PknotsRG IPknot and FlexStem softwares, the accuracy of the proposed algorithm, LIfold, is higher.

Key words: computer application, RNA secondary structure, pseudoknot, minimal free energy, pairing interaction

中图分类号: 

  • TP399
[1] Ren J, Rastegari B, Condon A, et al. HotKnots: heuristic prediction of RNA secondary structures including pseudoknots[J]. RNA,2005,11(10):1494-1504.
[2] Zuker M, Stiegler P. Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information[J]. Nucleic Acids Res,1981, 9(1): 133-148.
[3] 邹权, 郭茂祖, 张涛涛. RNA二级结构预测方法综述[J]. 电子学报, 2008, 36(2): 331-337.
Zou Quan, Guo Mao-zu, Zhang Tao-tao. A review of RNA secondary structure prediction algorithms[J]. Acta Electronica Sinica, 2008,36(2):331-337.
[4] 余军, 张长海, 张浩, 等. 基于茎区的动态规划的核糖核酸二级结构预测方法[J]. 吉林大学学报:工学版, 2011, 41(2): 452-457.
Yu Jun, Zhang Chang-hai, Zhang Hao, et al. Prediction of RNA Secondary structure using dynamic programming algorithm based on stems[J]. Journal of Jilin University( Engineering and Technology Edition),2011, 41(2): 452-457.
[5] Rivas E, Eddy S R. A dynamic programming algorithm for RNA structure prediction including pseudoknots[J]. J Mol Biol, 1999, 285(5): 2053-2068.
[6] Lyngs R B, Pedersen C N. RNA pseudoknot prediction in energy-based models[J].Computational Biology, 2000,7(3):409-427.
[7] Dirks R M, Pierce N A. A partition function algorithm for nucleic acid secondary structure including pseudoknots[J]. Comput Chem, 2003, 24(13): 1664-1677.
[8] 陈翔,卜东波, 张法,等. 基于局部茎区搜索的RNA二级结构预测算法[J]. 生物化学与生物物理进展,2009,36(l):115-121.
Chen Xiang, Bu Dong-bo, Zhang Fa,et al. A local stem search algorithm to predict the RNA secondary structure[J]. Process in Biochemistry and Biophysics,2009,36(1):115-121.
[9] Cao Song, Chen Shi-jie. Predicting RNA pseudoknot folding thermodynamics[J]. Nucleic Acids Research,2006,34(9):2634-2652.
[10] Gultyaev A P, van Batenburg F H, Pleij C W. An approximation of loop free energy values of RNA H-pseudoknots[J]. RNA,1999,5:609-617.
[1] 刘富,宗宇轩,康冰,张益萌,林彩霞,赵宏伟. 基于优化纹理特征的手背静脉识别系统[J]. 吉林大学学报(工学版), 2018, 48(6): 1844-1850.
[2] 王利民,刘洋,孙铭会,李美慧. 基于Markov blanket的无约束型K阶贝叶斯集成分类模型[J]. 吉林大学学报(工学版), 2018, 48(6): 1851-1858.
[3] 金顺福,王宝帅,郝闪闪,贾晓光,霍占强. 基于备用虚拟机同步休眠的云数据中心节能策略及性能[J]. 吉林大学学报(工学版), 2018, 48(6): 1859-1866.
[4] 赵东,孙明玉,朱金龙,于繁华,刘光洁,陈慧灵. 结合粒子群和单纯形的改进飞蛾优化算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1867-1872.
[5] 刘恩泽,吴文福. 基于机器视觉的农作物表面多特征决策融合病变判断算法[J]. 吉林大学学报(工学版), 2018, 48(6): 1873-1878.
[6] 欧阳丹彤, 范琪. 子句级别语境感知的开放信息抽取方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1563-1570.
[7] 刘富, 兰旭腾, 侯涛, 康冰, 刘云, 林彩霞. 基于优化k-mer频率的宏基因组聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1593-1599.
[8] 桂春, 黄旺星. 基于改进的标签传播算法的网络聚类方法[J]. 吉林大学学报(工学版), 2018, 48(5): 1600-1605.
[9] 刘元宁, 刘帅, 朱晓冬, 陈一浩, 郑少阁, 沈椿壮. 基于高斯拉普拉斯算子与自适应优化伽柏滤波的虹膜识别[J]. 吉林大学学报(工学版), 2018, 48(5): 1606-1613.
[10] 车翔玖, 王利, 郭晓新. 基于多尺度特征融合的边界检测算法[J]. 吉林大学学报(工学版), 2018, 48(5): 1621-1628.
[11] 赵宏伟, 刘宇琦, 董立岩, 王玉, 刘陪. 智能交通混合动态路径优化算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1214-1223.
[12] 黄辉, 冯西安, 魏燕, 许驰, 陈慧灵. 基于增强核极限学习机的专业选择智能系统[J]. 吉林大学学报(工学版), 2018, 48(4): 1224-1230.
[13] 傅文博, 张杰, 陈永乐. 物联网环境下抵抗路由欺骗攻击的网络拓扑发现算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1231-1236.
[14] 曹洁, 苏哲, 李晓旭. 基于Corr-LDA模型的图像标注方法[J]. 吉林大学学报(工学版), 2018, 48(4): 1237-1243.
[15] 侯永宏, 王利伟, 邢家明. 基于HTTP的动态自适应流媒体传输算法[J]. 吉林大学学报(工学版), 2018, 48(4): 1244-1253.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!