数据科学工厂 发表于 2024-7-1 15:29:28

ATAC-seq分析:数据处理(5)

## 1. 子集划分

我们可能希望将比对的读数分成代表核小体游离和核小体占据的读数。在这里,我们通过使用插入大小来过滤读取,为代表无核小体、单核小体和双核小体的读取创建 BAM 文件。

```R
atacReads_NucFree <- atacReads
atacReads_MonoNuc <- atacReads
atacReads_diNuc <- atacReads
```

## 2. BAM创建

读取的结果可以写回 BAM 文件,用于我们分析的其他部分,或者通过 rtracklayer 包中的函数在 IGV 等程序中进行可视化。

```R
nucFreeRegionBam <- gsub("\\.bam", "_nucFreeRegions\\.bam", sortedBAM)
monoNucBam <- gsub("\\.bam", "_monoNuc\\.bam", sortedBAM)
diNucBam <- gsub("\\.bam", "_diNuc\\.bam", sortedBAM)

library(rtracklayer)
export(atacReads_NucFree, nucFreeRegionBam, format = "bam")
export(atacReads_MonoNuc, monoNucBam, format = "bam")
export(atacReads_diNuc, diNucBam, format = "bam")
```

## 3. 创建 GRanges 片段

我们可以从单端读取中重新创建全长片段,以评估重复率并创建片段的 bigwig。在这里,我们使用 granges() 函数从配对的单端读取中重新创建完整片段。

```R
atacReads
```

!(data/attachment/forum/plugin_zhanmishu_markdown/202407/9f322827f7af730529d9f6c9fc1803fe_1719818965_3944.png)

```R
atacFragments <- granges(atacReads)
atacFragments
```

!(data/attachment/forum/plugin_zhanmishu_markdown/202407/16e8e0a467bc476389cc47e7a987eabe_1719818965_4911.png)

我们可以使用 duplicated() 函数来识别我们的全长片段的非冗余(非重复)部分。

```R
duplicatedFragments <- sum(duplicated(atacFragments))
totalFragments <- length(atacFragments)
duplicateRate <- duplicatedFragments/totalFragments
nonRedundantFraction <- 1 - duplicateRate
nonRedundantFraction
```

!(data/attachment/forum/plugin_zhanmishu_markdown/202407/9523cb7a36e03b884c27e28563ad8428_1719818965_9435.png)

## 4. 创建bigWig

通过创建一个 bigWig 文件,我们可以大大加快在基因组浏览器中查看 ATACseq 信号堆积的速度。此时可以对总映射读取进行额外的标准化。

```R
openRegionRPMBigWig <- gsub("\\.bam", "_openRegionRPM\\.bw", sortedBAM)
myCoverage <- coverage(atacFragments, weight = (10^6/length(atacFragments)))
export.bw(myCoverage, openRegionRPMBigWig)
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202407/d8102c122ffa168aa682fc95eefa3e9e_1719818965_2668.png)

---

欢迎Star -> [学习目录](https://github.com/Jwindler/Ice_story)

更多教程 -> [转录组测序分析教程合集](https://mp.weixin.qq.com/s?__biz=MzkwMzQwNjYyNg==&mid=2247485325&idx=1&sn=d665bf048ef86bbeee285d2be8b83106&chksm=c097f2c0f7e07bd65bbc855c9cb75c168961755ff099f6ae373ec0ff1fe6e975c2f0b4bf35cd#rd)

更多教程 -> [单细胞系列教程:合集](https://mp.weixin.qq.com/s?__biz=MzkwMzQwNjYyNg==&mid=2247485324&idx=1&sn=ea7e5ff479a70907c863e327833c0109&chksm=c097f2c1f7e07bd7597601b94160b7b1242d282ae39f1a8ae3710b2f7e852605309e24dc114a#rd)

---
页: [1]
查看完整版本: ATAC-seq分析:数据处理(5)