数据科学工厂 发表于 2024-7-8 21:42:02

ChIP-seq 分析:文库的复杂性和丰富性(7)

## 1. 文库复杂性

ChIPseq 中的一个潜在噪声源是 ChIPseq 库在 PCR 步骤中的过度放大。这可能会导致大量重复读取,从而混淆峰值调用。

!(data/attachment/forum/plugin_zhanmishu_markdown/202407/259f1e093c20f18194c447922b4d2a55_1720446117_6965.png)

## 2. 重复

我们应该比较样本之间的重复率,以确定任何经历过度放大的样本,从而确定复杂性较低的可能性。

flattagcounts() 函数报告可以报告重复的数量和总映射读取,因此我们可以从那里计算我们的重复率。

```R
myFlags <- flagtagcounts(myQC)
myFlags["DuplicateByChIPQC", ]/myFlags["Mapped", ]
```

!(data/attachment/forum/plugin_zhanmishu_markdown/202407/32d9af0e7bec55b5cc6f3042b95f743d_1720446116_3212.png)

## 3. 跨基因 reads 富集

我们还可以使用 ChIPQC 使用 plotRegi() 函数来查看我们在基因特征上的 reads 分布。

在这里,与输入样本相比,我们预计 ChIPseq 信号在 5'UTR 和启动子中更强。

```R
p <- plotRegi(myQC)
```

!(data/attachment/forum/plugin_zhanmishu_markdown/202407/c0af10263701ef57554799588ba6007c_1720446117_1748.png)
页: [1]
查看完整版本: ChIP-seq 分析:文库的复杂性和丰富性(7)