Signac 单细胞|ATAC-seq Call peak

单细胞测序 单细胞测序 327 人阅读 | 0 人回复 | 2024-08-23

引言

本文将向您展示如何利用MACS2软件,在单细胞ATAC-seq的基因组数据中识别基因调控区域的峰值。

实战

在使用Signac进行峰值检测之前,您需要先安装MACS2。您可以通过pip或conda安装它,或者从源代码自行编译。

本次演示以人类外周血单核细胞的单细胞ATAC-seq数据为例。首先,请加载必要的软件包和预先处理过的Seurat数据对象。

library(Signac)
library(Seurat)

pbmc <- readRDS("../vignette_data/pbmc.rds")
DimPlot(pbmc)

使用 CallPeaks() 函数可以进行峰值检测,这可以针对不同的细胞群体单独进行,或者综合所有细胞的数据来完成。若要在每个已标记的细胞类型上识别峰值,我们可以通过 group.by 参数来实现。

peaks <- CallPeaks(
  object = pbmc,
  group.by = "predicted.id"
)

结果以 GRanges 对象的形式返回,并带有一个附加元数据列,列出了每个峰在其中识别的细胞类型:

要计算每个峰值区域的计数,您可以利用 FeatureMatrix() 函数来实现。

通过 CoveragePlot() 函数,我们可以将特定于细胞类型的 MACS2 峰值检测结果与 10x Cellranger 的峰值检测结果(目前 pbmc 对象中正在使用的)进行可视化对比。在图中,Cellranger 的峰值以灰色表示,而 MACS2 的峰值则以红色标注。

CoveragePlot(
  object = pbmc,
  region = "CD8A",
  ranges = peaks,
  ranges.title = "MACS2"
)

## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_segment()`).

微信扫一扫分享文章

+10
无需登陆也可“点赞”支持作者
分享到:
评论

使用道具 举报

2755 积分
243 主题
+ 关注
热门推荐