minimap2+svim-asm+SURVIVOR流程基于基因组组装做结构变异检测

基因组 基因组 544 人阅读 | 0 人回复 | 2024-06-03

代码主要参考 GraffiTE 的代码,链接 https://github.com/cgroza/GraffiTE/blob/main/main.nf 这个工具是利用二代测序数据给TE做基因型分型然后研究TE多态性的。前面的步骤是基于组装好的基因组进行比对检测结构变异。我们把这部分代码拆出来学习一下。

使用拟南芥的数据集做测试

minimap2比对

minimap2 -ax asm5 --cs -r2k -t 16 ../Cvi.chr.all.v2.0.fasta ../Kyo.chr.all.v2.0.fasta | samtools sort -@ 8 -O BAM -o Kyo.sorted.bam

minimap2 -ax asm5 --cs -r2k -t 16 ../Cvi.chr.all.v2.0.fasta ../Ler.chr.all.v2.0.fasta | samtools sort -@ 8 -O BAM -o Ler.sorted.bam

minimap2 -ax asm5 --cs -r2k -t 16 ../Cvi.chr.all.v2.0.fasta ../Sha.chr.all.v2.0.fasta | samtools sort -@ 8 -O BAM -o Sha.sorted.bam
samtools index Kyo.sorted.bam
samtools index Ler.sorted.bam
samtools index Sha.sorted.bam

检测结构变异

svim-asm haploid --min_sv_size 50 --types INS,DEL,INV --sample Ler Ler Ler.sorted.bam ../Cvi.chr.all.v2.0.fasta


svim-asm haploid --min_sv_size 50 --types INS,DEL,INV --sample Kyo Kyo Kyo.sorted.bam ../Cvi.chr.all.v2.0.fasta

svim-asm haploid --min_sv_size 50 --types INS,DEL,INV --sample Sha Sha Sha.sorted.bam ../Cvi.chr.all.v2.0.fasta 

合并vcf文件

cp Kyo/variants.vcf output.vcfs/kyo.vcf
cp Ler/variants.vcf output.vcfs/ler.vcf
cp Ler/variants.vcf output.vcfs/ler.vcf
ls output.vcfs/*.vcf > vcf.list

SURVIVOR merge vcf.list 0.1 0 1 0 0 100 svim_asm_variants.vcf

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

微信扫一扫分享文章

+10
无需登陆也可“点赞”支持作者
分享到:
评论

使用道具 举报

热门推荐