R语言里将vcf文件转换为GenAlEx格式数据

数据可视化 数据可视化 756 人阅读 | 0 人回复 | 2024-06-03

GenAlEx 格式

https://grunwaldlab.github.io/Population_Genetics_in_R/Data_Preparation.html

在这个链接里有介绍

如果有了这个格式的数据可以用R语言的poppr包做主成分分分析。

公众号有读者留言问到如何将vcf格式的数据转换成 genalex格式

我查了一下找到一个链接

https://rdrr.io/github/green-striped-gecko/dartR/man/gl2genalex.html

Converts a genlight object into a format suitable for input to genalex

如何获取 genlight object

找到了一个参考链接

https://cran.r-project.org/web/packages/vcfR/vignettes/converting_data.html

这里需要用到vcfR这个R包

安装这两个R包

install.packages("vcfR")
BiocManager::install("SNPRelate")
install.packages("dartR")
install.packages("poppr")

加载R包

library(vcfR)
library(dartR)
library(poppr)

读取vcf文件进行转换

vcf<-read.vcfR("D:/Jupyter/practice/rMVP_GWAS/smoove.filtered.impute.vcf.gz")
x <- vcfR2genlight(vcf)

x$ind.names ## 按照这个顺序准备一个群体分组

pop(x)<-sample(c("pop1","pop2","pop3"),102,replace = TRUE) ## 我这里的群体分组是随便给的
gl2genalex(x,outfile = "smoove.csv",outpath = "D:/Jupyter/practice/rMVP_GWAS")

部分输出结果

image.png

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

微信扫一扫分享文章

+10
无需登陆也可“点赞”支持作者
分享到:
评论

使用道具 举报

热门推荐