崔耳又又 发表于 2024-7-20 17:01:06

Hi-c如何辅助基因组组装,其具体原理是什么?

Hi-c如何辅助基因组组装,其具体原理是什么?

i生信 发表于 2024-8-14 14:07:59

Hi-C 是一种染色体构象捕获技术,可以在基因组组装过程中发挥重要作用。其主要原理是通过捕获和测序在空间上接近但在基因组线性序列上分离的 DNA 片段,从而提供三维染色体结构的信息。这些信息可以帮助科学家准确地组装高度复杂的基因组。

以下是 Hi-C 辅助基因组组装的具体步骤和原理:

1. 样本制备
交联 (Cross-linking):使用化学试剂(如甲醛)交联培养细胞中的 DNA 和蛋白质,从而将空间上相邻的 DNA 片段固定在一起。
DNA 消化 (Digestion):使用限制性内切酶切割 DNA,将基因组分割成较小的片段。
填补末端 (End-Filling) 和连接 (Ligation):使用 DNA 聚合酶填补切割后产生的粘性末端,然后使用 DNA 连接酶将空间上相邻的 DNA 片段连接在一起,形成交联的产物。
2. DNA 测序
反向交联 (Reverse Cross-linking):使用加热或化学方法逆转交联,释放互相连接的 DNA 片段。
纯化和扩增 (Purification and Amplification):纯化目标 DNA 片段,并使用 PCR 方法扩增这些片段。
高通量测序 (High-Throughput Sequencing):使用高通量测序技术(如 Illumina)对扩增的 DNA 片段进行测序,生成大量的短读长(short reads)。
3. 数据分析
读长映射 (Read Mapping):将测序得到的短读长映射到一个初步组装好的基因组草图上。
互动矩阵 (Interaction Matrix):统计每对短读长在基因组草图上的位置,构建一个互动矩阵,反映 DNA 片段在三维空间中的接触频率。
基因组组装 (Genome Assembly):利用互动矩阵增强初步组装的基因组草图,通过判断哪些片段在三维空间中接近而应当在一维线性序列中相邻,从而优化和校正基因组组装。
Hi-C 在基因组组装中的作用
提高染色体级别的组装精度:Hi-C 数据提供了染色体内和染色体间的三维结构信息,可以帮助确认重叠序列的相对位置,从而提高基因组组装的精度。
解决重复序列问题:由于 Hi-C 数据反映了染色体三维构象,可以帮助区分重复序列和串联重复区段,减少基因组组装的歧义。
校正和验证基因组组装:Hi-C 数据可以用来验证初步组装结果的正确性,发现和校正错误的基因组拼接。

综上所述,Hi-C 技术通过提供 DNA 片段在三维空间中的接触信息,有效地辅助和优化了复杂基因组的组装过程。
页: [1]
查看完整版本: Hi-c如何辅助基因组组装,其具体原理是什么?