数据科学工厂 发表于 2024-6-28 12:14:07

RNA-seq 详细教程:结果汇总与提取(11)

## 学习目标

1. 评估每次比较产生的差异表达基因的数量
2. 从每次比较中构建包含重要基因的 R 对象

## 1. 汇总

为了汇总结果,`DESeq2` 中一个方便的函数是 `summary()`。它与用于检查数据帧的函数同名。当使用 `DESeq` 结果表作为输入调用此函数时,将使用默认阈值 `padj < 0.1` 汇总结果。但是,由于我们在创建结果表阈值时将 `alpha` 参数设置为 0.05:`FDR < 0.05`(即使输出显示 p 值 < 0.05,也使用 padj/FDR)。让我们从 OE 与对照结果开始:

```R
summary(res_tableOE, alpha = 0.05)
```

除了在默认阈值下上调和下调的基因数量外,该函数还报告了被测试的基因数量(总读数非零的基因),以及未包括在多重测试中的基因数量由于平均计数较低而进行的校正。

## 2. 提取

- 提取显著差异表达基因

让我们首先创建包含我们的阈值标准的变量。我们只会在我们的标准中使用调整后的 p 值:

```R
padj.cutoff <- 0.05
```

我们可以使用 `filter()` 函数轻松地对结果表进行子集化以仅包括那些重要的,但首先我们会将结果表转换为小标题:

```R
res_tableOE_tb <- res_tableOE %>%
data.frame() %>%
rownames_to_column(var="gene") %>%
as_tibble()
```

现在我们可以对该表进行子集化,以仅使用我们预定义的阈值保留重要基因:

```R
sigOE <- res_tableOE_tb %>%
      filter(padj < padj.cutoff)
```
页: [1]
查看完整版本: RNA-seq 详细教程:结果汇总与提取(11)