2021 Annual Research Progress ( HK Branch)

154 摘要 当前非模型动物基因组组装一般是通过使用长读段和 高通量染色体构象捕获(Hi-C)共同完成。然而,染色 体构象捕获实验成本高,涉及多个复杂的实验步骤, 且需要高质量的染色质样品。近期的研究表明,染色 体构象捕获实验得到的连锁信息与DNA碱基修饰有 极高的相关性,这使得基于全基因组DNA修饰信息来 进行基因组组装成为可能。在该项目中,李教授团队 使用牛津纳米孔测序技术开发了使用DNA碱基修饰代 替高通量染色体构象捕获进行基因组组装的方法工具 包,并计划以三个海洋无脊椎动物基因组为例测试并 完善该工具包。染色体水平的基因组,完整且准确的 基因注释,连同DNA碱基修饰得到的基因组连锁信 息,将为海洋无脊椎动物染色体基因的序列和位置保 守性的进化分析提供新思路。 研究活動和進展 • 使用客制化的深度学习模型(基于megalodon流 程),从纳米孔测序数据中获得三个海洋软体生物全 基因组5mC修饰数据; • 开发了modscaf流程,使用不同区段5mC碱基修饰 信息作为特征数据进行基因组的组装; • 发表名为“trackcluster”的流程方法,并使用该方 法利用纳米孔长读段测序,改进基因组注释。 主要發現 • 非 模 式 生 物 的 基 因 组 注 释 完 整 度 可 以 通 过“trackcluster”流程进行提升; • modscaf 流程使得仅使用纳米孔长读段技术获得 染色体级别基因组成为可能。以鳞足螺为例,97% 的基因组序列都可以通过modscaf流程正确组装到 染色体级别。 研究成果 发表文章 0 培养人才 2 開發基於納米孔DNA修飾信息的新型基因組構架工具包及 其在深海無脊椎動物基因組中的應用 李润生教授 香港城市大学 图2. 用于长RNA序列读取的trackcluster

RkJQdWJsaXNoZXIy NDk5Njg=