他叫杨晓旭,本科和博士分别毕业于北师大和北大。博士毕业后,他来到美国加州大学圣地亚哥分校、Rady 儿童遗传学研究所约瑟夫·格里森(Joseph Gleeson)教授实验室从事博士后研究。
图丨团队合照(来源:杨晓旭)
多年来,杨晓旭的研究方向主要聚焦在利用生物信息学和分子生物学手段,研究人类基因组嵌合突变(Mosaic variants,MVs)在胚胎发育和疾病中的作用。
2023 年 1 月 2 日,由其担任共同一作和共同通讯作者的论文,以《基于 DeepMosaic 的非对照嵌合单核苷酸变异检测》(Control-independent mosaic single nucleotide variant detection with DeepMosaic)为题发表在Nature Biotechnology上[1]。
图丨相关论文(来源:Nature Biotechnology)
杨晓旭和加州大学圣地亚哥分校、Rady 儿童遗传学研究所徐歆为论文的共同第一作者,杨晓旭和约瑟夫·格里森教授为论文的共同通讯作者。
合子后 MV 主要是在胚胎发育以后发生的突变,只会对少部分细胞造成影响。
虽然从理论上讲,每个人的每个细胞的基因组来源于一样的拷贝,但其实诸如发育、衰老等过程,以及抽烟、喝酒等行为,都会导致人类的每一个细胞积累不同的突变。而在细胞分裂的过程中,这些突变又会被传递给子代细胞。
常见的 MV 是与癌症相关的突变,与非癌症相关的突变研究相对较少,对应的检测工具也比较有限。
因此,为了更好地检测非癌症的 MV,杨晓旭所在的团队逐渐开发了一些检测工具,而本次研究中涉及到的成果 DeepMosaic,就是一个新的检测方法和检测手段。
该工具不仅可以为人类发育和疾病研究提供良好的帮助,还有利于相关领域的研究者们在更大程度上理解人类突变。
图丨DeepMosaic 图像表示、模型训练策略及框架(来源:Nature Biotechnology)
据杨晓旭介绍,该研究始于 2018 年末。当时,他和团队正在同时开展好几个不同的研究项目。
过程中,他们发现已有的检测工具并不能很好地识别那些在正常 DNA 序列中隐藏的 MV,必须凭借人眼和相应的经验进行判断和确认,这不仅大大增加了工作时长,还提高了出错的可能性。
为了解决这个问题,他们提出开发一种基于视觉的深度学习手段,能够代替人眼发现 MV。
最开始我们想从头训练一个视觉处理的模型,但发现这需要借助非常庞大的训练数据。
后来,我们决定采用迁移学习的方法,借用那些已经做得比较好的图像识别模型,并用我们自己的训练数据对其进行重新训练,再从中找到表现最好的模型。
为了证明通过上述方法找到的突变,的确是真实存在的突变,我们还做了一系列生物学验证实验。杨晓旭解释道。
图丨基于生物数据验证的 DeepMosaic 性能(来源:Nature Biotechnology)
在此过程中诞生的 DeepMosaic,结合了基于图像的单核苷酸 MV 的可视化模块,和基于卷积神经网络的、用于不依赖对照样本的 MV 检测的分类模块。
据介绍,该团队用 18 万个模拟或实验验证过的 MV 对 DeepMosaic 进行了训练,并对来自 16 个基因组和 181 个外显子的超过 6 万个模拟 MV 和 530 个独立的实验验证过的 MV 进行了基准测试。
结果表明,与传统的生物数据方法相比,从灵敏度、特异性和阳性预测值来看,DeepMosaic 在非癌症全基因组测序数据上的检测准确率更高。同时,其在全外显子组测序数据上的验证率,也是此前报道最优方法的 2 倍。
利用 DeepMosaic 和其他方法,该团队在皮质发育畸形中发现了大量此前未知的嵌合突变,并利用小鼠模型、病理切片染色、单细胞转录组测序等证实了这些突变的致病性,该研究于近日发表在Nature Genetics上[2]。
虽然该团队开发 DeepMosaic 的初衷是提高非癌症嵌合突变的检测效率,但仍不免被审稿人问到该工具在检测癌症嵌合突变上的表现。
在此启发下,杨晓旭表示:我们目前已经拿到了很多与癌症相关的样本和数据,下一步计划继续根据 DeepMosaic 的框架,训练一个特异性的可以检测癌症嵌合突变的深度学习模型。
另外,由于目前该团队基于 DeepMosaic 检测的数据类型主要是全基因组和全外显子组,所以未来其还将拓展至更多的数据类型。
因为 DeepMosaic 所有的代码都是开源的,所以它给我们提供的不仅仅是一个工具,更是一个平台。
并且,我们也提供了一些训练代码,和一些已经训练完成或训练了一半的模型,希望该领域的所有研究者可以用他们自己手里的数据,去训练自己的 DeepMosaic 模型,这样更有利于促进领域内基于图像识别的嵌合突变检测工具的应用。杨晓旭最后说。
参考资料:
1.Yang, X., Xu, X., Breuss, M.W. et al. Control-independent mosaic single nucleotide variant detection with DeepMosaic.Nature Biotechnology (2023). https://doi.org/10.1038/s41587-022-01559-w
2.Chung, C., Yang X., Bae T., et al. Comprehensive multi-omic profiling of somatic mutations in malformations of cortical development.Nature Genetics(2023). https://doi.org/10.1038/s41588-022-01276-9
https://www.news-medical.net/news/20230102/Deep-learning-tool-identifies-mosaic-mutations-that-cause-disease.aspx
免责声明:内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,本网站所提供的信息只供参考之用。