数据导入
# 加载包
library(phyloseq)
library(Biostrings)
library(tidyverse)
.将特征表、分组文件、注释信息导入R中,其中特征表和注释信息需要转换为matrix格式:
asvtab <- read.delim("./asvtab.txt", row.names=1) %>%
as.matrix()
metadata <- read.delim("./metadata.txt", row.names=1)
taxonomy <- read.delim("./taxonomy.txt", row.names=1) %>%
as.matrix()
使用biostrings包导入fasta格式的代表性序列文件:
dna_sequences <- readDNAStringSet("ASV.fa")
使用ape包导入树文件,树文件可以是.tree文件或.nexus文件。
制作phyloseq文件:
OTU = otu_table(asvtab, taxa_are_rows = TRUE)
TAX = tax_table(taxonomy)
MET = sample_data(metadata)
SEQ = refseq(dna_sequences)
physeq = phyloseq(OTU, TAX, MET, SEQ)
保存phyloseq文件:
saveRDS(physeq, file = "./physeq_data.rds")
下次再使用这套数据使用readRDS读取即可:
physeq2 <- readRDS(file = "./physeq_data.rds")
|