在广东省“珠江人才计划”本土创新科研团队项目、国家自然科学基金项目(批准号:81530028,81721003)等项目资助下,中山大学中山眼科中心刘奕志/肖传乐团队联合中南大学王建新团队,在三代测序数据校正组装和眼干细胞基因组解码领域取得重要进展,研究成果以“Efficient assembly of Nanopore reads via highly accurate and intact error correction”为题,于2021年1月4日在Nature Communications(《自然-通讯》)上发表。陈颖、聂藩、谢尚潜、郑颖丰、代琦为共同第一作者,王建新、刘奕志和肖传乐为该文章的共同通讯作者。
论文连接:https://www.nature.com/articles/s41467-020-20236-7
解码生物体基因组为破解生命遗传规律、预测疾病发生发展带来希望,对人类生存具有重要意义。三代测序技术(如Nanopore)是目前实现基因组测序和组装的有力技术工具,但测序错误分布广泛严重阻碍生物体基因组的解码进度。
该研究研发一种新型Nanopore测序数据校正组装算法并开发相应的软件——NECAT。通过采用渐进式序列校正和组装策略,研究者有效恢复测序原始数据中99%的高错误局部区域,分别利用高精度序列和原始序列组装基因组骨架并丰富基因组,最终保证了基因序列校正的准确性和基因组组装的完整性。
NECAT 对测序数据组装的完整性明显高于同类软件,与部分组装软件联合使用可显著提高其它组装软件的组装质量。
借助NECAT,研究者对视网膜细胞的Nanopore测序数据进行分析,组装出完整度较高的基因组,发现大量高精度基因结构变异位点,为针对眼组织细胞的靶向治疗和发生机制,提供了大量有临床价值的研究靶点。