所内动态
2012年12月28日,中科院计算所pFind研究团队与我所董梦秋实验室在《Journal of Proteome Research》杂志发表题为“ pNovo+: De Novo Peptide Sequencing Using Complementary HCD and ETD Tandem Mass Spectra”的论文。
2012年12月28日,中科院计算所pFind研究团队与我所董梦秋实验室在《Journal of Proteome Research》杂志发表题为“ pNovo+: De Novo Peptide Sequencing Using Complementary HCD and ETD Tandem Mass Spectra”的论文。
文章报道的pNovo+从头测序 (de novo sequencing) 软件不需要蛋白序列信息,直接从串联质谱图中鉴定肽段,在精度和速度上大幅度超越同类软件,包括pNovo+的前身pNovo (Chi H. et al., JPR, 2010 )。pNovo在一项揭示线虫纲精细胞激活和精子竞争的研究中发挥了关键作用 (Zhao Y. et al., PNAS, 2010 )。
pNovo+一方面传承了pNovo的精髓,另一方面它大胆突破,重新设计算法,几近脱胎换骨。第一时间,pNovo+融合同一个肽段的高精度HCD和ETD谱图,充分利用两者的高精准度和互补性,使得谱图的解析率和结果的准确度大幅度提升。以胰酶或Asp-N酶切样品所产生的有可靠鉴定结果的谱图为测试数据,至少85%的谱图能够在pNovo+给出的排名第一的候选序列中找到正确答案,95%的谱图能在前三个候选序列中找到正确答案。对于GLu-C酶切得到的长肽段和Elastase酶切得到的没有末端氨基酸特异性的肽段,70%以上的谱图都能在前三个候选序列中找到正确答案。两年前pNovo在胰酶酶切肽段的HCD数据上取得的成绩是:80%以上的有可靠鉴定结果的谱图能够在前十个候选序列中找到正确答案。另外,pNovo+摈弃了从头测序领域不断尊崇的“反对称原则”,从NP-hard问题的大运算量的束缚中解脱出来,速度飙升到每秒解析50张谱图,堪比现在最快的质谱仪的谱图采集速度。
中科院计算所博士研究生迟浩和硕士研究生陈海丰是本文的共同第一作者,计算所贺思敏博士和我所董梦秋博士与为本文的共同通讯作者。计算所的何昆、邬龙、孙瑞祥、曾文锋,北京航空航天大学的刘建芸,以及董梦秋实验室的杨兵、宋春青参与了文本的研究工作。此项目由科技部(973-2010CB912701, 973-2010CB835203, 973-2012CB910602)和中科院(KGCX1-YW-13,20120633)共同资助完成。