ChIP-seq 分析:文库的复杂性和丰富性(7)
## 1. 文库复杂性ChIPseq 中的一个潜在噪声源是 ChIPseq 库在 PCR 步骤中的过度放大。这可能会导致大量重复读取,从而混淆峰值调用。
!(data/attachment/forum/plugin_zhanmishu_markdown/202407/259f1e093c20f18194c447922b4d2a55_1720446117_6965.png)
## 2. 重复
我们应该比较样本之间的重复率,以确定任何经历过度放大的样本,从而确定复杂性较低的可能性。
flattagcounts() 函数报告可以报告重复的数量和总映射读取,因此我们可以从那里计算我们的重复率。
```R
myFlags <- flagtagcounts(myQC)
myFlags["DuplicateByChIPQC", ]/myFlags["Mapped", ]
```
!(data/attachment/forum/plugin_zhanmishu_markdown/202407/32d9af0e7bec55b5cc6f3042b95f743d_1720446116_3212.png)
## 3. 跨基因 reads 富集
我们还可以使用 ChIPQC 使用 plotRegi() 函数来查看我们在基因特征上的 reads 分布。
在这里,与输入样本相比,我们预计 ChIPseq 信号在 5'UTR 和启动子中更强。
```R
p <- plotRegi(myQC)
```
!(data/attachment/forum/plugin_zhanmishu_markdown/202407/c0af10263701ef57554799588ba6007c_1720446117_1748.png)
页:
[1]