BWA-MEM比对算法性能更好的bwa-mem2

基因组 基因组 447 人阅读 | 0 人回复 | 2024-09-01

1. bwa-mem2简介

工具bwa-mem2是bwa(李恒开发)bwa-mem算法的下一个版本, 由英特尔并行计算实验室的Vasimuddin Md和Sanchit Misra开发完成的,相比于bwa-mem速度快1.3-3.1倍,还极大降低了内存和存储使用量。

目前bwa-mem比对算法广泛运用在在临床WES/WGS/CNV-seq/NIPT等项目中,用于将clean fastq比对到人类hg19/hg38参考基因组。

bwa github: https://lh3.github.io/2018/04/02/minimap2-and-the-future-of-bwa

bwa-mem2 github: https://github.com/bwa-mem2/bwa-mem2

2. 测试数据集(bwa-mem VS bwa-mem2)

比较了bwa-mem和bwa-mem2在D1-D4数据集上单端SE和双端PE数据的比对所消耗的时间,bwa-mem2速度均有一定比例的提升。

图片.png

图片.png

3. bwa-mem2安装

# 使用预编译的二进制版本(推荐)
# 下载解压
curl -L https://github.com/bwa-mem2/bwa-mem2/releases/download/v2.2.1/bwa-mem2-2.2.1_x64-linux.tar.bz2 | tar jxf -

cd bwa-mem2-2.2.1_x64-linux 

# 加入环境变量
echo "export PATH=$(pwd):PATH" >> ~/.bashrc
source ~/.bashrc

# 查看帮助信息
bwa-mem2

Usage: bwa-mem2 <command> <arguments>
Commands:
  index         create index
  mem           alignment
  version       print version number

4. 基本用法

使用方法与BWA MEM工具完全相同。

# 构建参考序列索引
bwa-mem2 index ref.fa
samtools index ref.fa

# 双端fastq比对
bwa-mem2 mem -t 10 ref.fa read1.fq read2.fq > out.pe.sam

# bwa-mem2+samtools管道
bwa-mem2 mem -t 4\
-M -R "@RG\\tID:sample\\tPL:ILLUMINA\\tLB:sample\\tSM:sample" \
ref.fa read1.fq read2.fq \
|samtools sort -@ 4 -o sample.pe.sort.bam

# 单端fastq比对
bwa-mem2 mem -t 10 ref.fa read1.fq > out.se.sam

微信扫一扫分享文章

+10
无需登陆也可“点赞”支持作者
分享到:
评论

使用道具 举报

热门推荐