Nat. Mach. Intell. | 深度学习预测糖肽串联质谱谱图

  • A+
分享一篇Nature Machine Intelligence上的文章Deep learning prediction of glycopeptide tandem mass spectra powers glycoproteomics,本文通讯作者是来自复旦大学的乔亮教授。其研究方向包括蛋白质组学、生物信息学、微生物质谱分析、微流控质谱联用技术等。


1
翻译后修饰能极大增加蛋白质组的复杂度,其中糖基化是影响50%哺乳类动物蛋白的重要翻译后修饰,在多种生理及病理过程中起到了重要的作用。蛋白质糖基化中糖分子通常连接到天冬酰胺(N-糖基化)或丝氨酸/苏氨酸(O-糖基化)的侧链。糖链的合成没有模板,因此其非常多样,对其组成及连接方式进行表征具有极大的挑战。作者在本文中发展了DeepGP的方法,使用深度学习的方法预测N-糖肽的二级谱图与保留时间,帮助更好地在质谱上识别糖肽。
2
DeepGP接受糖肽为输入,并编码其多个特征,例如糖结构,氨基酸序列,PTM类型,PTM位置及母离子电荷等。糖结构由GNN进行编码,在其中糖链会转化为单糖为节点、单糖间的键为边的图,这可以很好捕捉到糖的组成及拓扑结构。糖肽的表征经过transformer以预测出二级谱图及保留时间,另外会有额外的GNN模块预测糖碎片离子的强度。DeepGP也考虑了多种中性丢失的碎片离子,其强度也会被预测。
6
作者将HCD碎裂的糖肽数据用pGlyco3进行分析,得到的结果用于训练模型。经过优化后,预测出的二级谱图与实验值有非常高的相似度,特别是糖碎裂产生的B/Y离子的强度也与实验值有很高的相似度,对保留时间的预测也有很好的准确性,对于很相似的糖链也有好的区分效果。作者将DeepGP预测的结果能进一步地优化糖肽搜库的结果。
本文作者:JGG
责任编辑:ZF
文章链接:
https://www.nature.com/articles/s42256-024-00875-x.pdf
文章引用:10.1038/s42256-024-00875-x




weinxin
我的微信
关注我了解更多内容

发表评论

目前评论: