基于TBtools做基因家族分析 | 生信部分 | 一 - 数据可视化 - ResBang生信交流网

小杜的生信笔记 发表于 2024-6-27 22:20:08

基于TBtools做基因家族分析 | 生信部分 | 一

# **原文链接：[基因TBtools做基因家族分析 | 生信部分](https://mp.weixin.qq.com/s/brDV1v4Y5cUWylbB7Wvb1w)**

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/d3688f6b5514b140cc2170943d77b911_1719497854_5600.jpg)

**「一边学习，一边总结，一边分享！」**

# **一、写在前面**

**2023年4月中旬自己开始做基因家族的分析，对于这块自己没有接触过，因此也是一个挑战，没事！！！（安慰自己），对于基因家族的分析网上的教程很多，跟着步骤走就可以。在这部分，我自己主要是做生信这块，实验验证是师姐在做，所以论文结构自己不用操心。此外，可视化的工具很多，也很方便，不需要自己特意去学。**

**此外，本次分析80%的内容都是基于TBtools。确实牛X!!自己开始接触TBtools是在2019年吧，也是通过一个师兄的推荐才知道的。2019年CJ还没将TBtools发表在MP上，那时还是预印版本吧。但是，引用已经有了很多，了不起哦。后面TBtools一直在开发新的的小“软件” or“程序”，将生信分析的门槛一降再降。点赞点赞！！！                            --Du**

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2505a9951fb148ead8b14a8e3f6e4a58_1719497686_7742.jpg)

---

# [原文链接：[基因TBtools做基因家族分析 | 生信部分](https://mp.weixin.qq.com/s/brDV1v4Y5cUWylbB7Wvb1w)]

**注意：此教程有些话语可能会带有自己的方言，读不通时也不要在意！！[泪目！]**

---

# **一，在Pfam数据中获得基因家族**

**我们这里预测作物中某一个基因家族的基因，目前在此作物中未报道。因此，使用Pfam数据库中一致的基因进行同源搜索（其实，你也可以使用已知作物中的基因进行同源搜索，获得结果基本一致）。那么我们就根据文章中和报道的Pfam数据库中的基因作为基序，进行同源搜索。**

1. **在Pfam数据库中下载FBNs基因家族（Pfam 04755)，Pfam网址：**[https://pfam-legacy.xfam.org/](https://pfam-legacy.xfam.org/)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/869d193303667d5e1e355d2fc3f68536_1719497686_2285.jpg)
2. **打开网址:**[http://www.ebi.ac.uk/interpro/entry/pfam/?search=0477#table](http://www.ebi.ac.uk/interpro/entry/pfam/?search=0477#table)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/edba2a6380c20f0a04bdd406cd4d2518_1719497686_3061.jpg)

* **点击进入**PF04775**，下载所有的Proteins序列**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/c65be76bf1cd9beacc26a247f1f44b32_1719497686_6453.jpg)

---

**以上只是其中的一种方法，但为获得FBN基因家族的蛋白序列。下面使用Pfam数据中搜索**

1. **打开网页。https://pfam-legacy.xfam.org/**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/394ac51d3b5016dea864fed1c30dcff3_1719497686_7463.jpg)
2. **搜索**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/59b67cc57803f9b76637bcd21afc0142_1719497686_6947.jpg)
3. **进入**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/1f40109d23c9e42b8f2571d3388b12b4_1719497686_8564.jpg)
4. **搜索后获得PAP\_fibrillin**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/48ae806f68c9ccbed1f9a2c883b976fb_1719497686_3725.jpg)下载**Reviewed**的PF04755序列![](data/attachment/forum/plugin_zhanmishu_markdown/202406/bd5f4db4431e5c8271fdc238c2d8cd84_1719497686_7993.jpg)

---

# **二、同源序列检索预测**

**对于同源基因的搜索，很多基因家族的文章都使用HMMER进行检索，也有一些文章是使用BLAST。你任选其中一个即可，都能获得你想要的结果同源基因。在做分析的时候，我将**[使用Hmmer寻找同源基因](https://mp.weixin.qq.com/s/vMxxcaQGRcGKyDY-MLmEGg)的文章分享在公众号中，在评论区有一个大佬对HMMER和BLAST之间的差异给出回答。

**这两个方法原理上区别，balstp是基于序列同源性进行打分的，有打分矩阵，hmm是基于隐马尔可夫模型，对序列结构域进行比对。****来自“泼皮混混”的评论。**

## 2.1 HMMER同源结构域搜索

### 2.1.1 Hmmer的安装

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/8608b5de96d74e0fef51d4c14a8d959f_1719497686_7440.jpg)

**安装，主要是使用源码安装或是是使用**conda**进行安装即可。**

1. **conda安装**

```plain
conda install -y hmmer
```

1. **源码安装：** **官网****：http://www.hmmer.org/**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/e354d753b74721dcd4efc3582ccfe0a3_1719497686_4662.jpg)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/4422da7c4d6ccf402f488dd5a3bf67a6_1719497686_7336.jpg)任意下载一个版本即可，安装步骤不再做说明。

### 2.1.2 使用hmmbuild构建.hmm文件

**在有些数据库中是有**.hmm**文件，只需要下载即可。但是，这仅仅只限于有些大数据库。对于我们自己使用，不可能全部都有，这就需要我们自己构建，\*\*很多教程到这步就是让你收费了.......\*\*。**

**在本教程，讲述其中一种方法吧，希望对大家有所帮助。**

**hmmbuild构建时，需要使用**.sto**文件进行构建。因此，我们必须获得**.sto**文件。**

1. **使用mafft软件进行间序列进行对齐**

```plain
mafft --auto --clustalout ../Pfam_PF04755_reviewed.fasta > Hmmbuild_index/Pfam.FBNs.align.clustal
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/477a1137413f4b5358f6392490047c79_1719497686_5787.jpg)转换：** **[http://sequenceconversion.bugaco.com/converter/biology/sequences/fasta\_to\_phylip.php](http://sequenceconversion.bugaco.com/converter/biology/sequences/fasta_to_phylip.php)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/b9a658d77ef04d5f555945391a842c9f_1719497686_3960.jpg)

* **hmmbuild构建文件**

```plain
hmmbuild Pfam.FBNs.hmm sample.stockholm
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/ef8b7b959ee6b8d8550ca2d2f664e52c_1719497686_4590.jpg)

* **hmmsearch**

```plain
hmmsearch Hmmbuild_index/Pfam.FBNs.hmm Potato/DM_1-3_516_R44_potato.v6.1.working_models.pep.fa > ../02_Result/Potao.hmmer.out.txt
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/fb0ceb171d7b58515dcad9456f212b0f_1719497686_2797.jpg)

* **筛选出最佳的结果，E-value值小于**1e-5**,Score值大于“> 90”**
* **对于筛选结果，可以直接使用Hmmsearch获得结果；也可以如上所示根据自己需求进行筛选，自己做的话，如果搜索的目的基因太多，而自己不需要这么多的同源基因，自己会进行手动过滤一些同源性较弱的基因。**

```plain
cat Potato.hmmer.out.txt |grep -v "#" | awk '{if($4 < 1e-5 && $5 > 90) print $9}' | sort | uniq | grep -v "+" > Potato.hmmer.best.out.txt
```

---

## 2.2 提取目的基因序列

**日志：通过Hmmsearch获得同源基因的ID，那么后面对目的同源基因进行进化树、结构域、motif等的分析，这些分析都需使用目的同源基因的序列。**

**如何获得同源基因序列？？**

---

1. **使用脚本获得**
2. **使用ggffead获得，需要获得同源基因的**.gtf**文件等信息。**
3. **生信工具获得、如TBtools等。**

**对于这步、我们就多做讲解，使用自己拿手的方式获得即可。**

---

**问：****后面的分析使用核酸序列 or蛋白序列呢？？**

**答：****都可以。**

**FBN 家族的分析日志。使用Pfam、拟南芥（11）和水稻的FBN家族基因同源搜索马铃薯中的FBN同源基因**

```plain
## 水稻中的FBN家族基因
cat all.pep | grep ">" | grep fibrillin |awk -F "|" '{print $1}' | awk -F " " '{print $1}' | sed 's/>//g' > O_sativa.FBN.id.txt
```

```plain
##拟南芥中FBN家族基因
可以在拟南芥网址中的同源搜索，也可以在拟南芥蛋白数据中搜索
cat Araport11_pep_20220914 | grep FBN | awk -F "|" '{print $1}' | sed 's/>//g' > Araport11_FBN.id
```

## 2.3 使用TBtools提取目的基因

**说实话，TBtools确实是个很牛的生信工具，基本可以让你不写代码获得你想要的东西。以及，各种类型的小脚本软件都一直在开发。赞赞！！**

### 2.3.1 TBtools软件的下载

1. **网址：**[https://github.com/CJ-Chen/TBtools](https://github.com/CJ-Chen/TBtools)
2. **安装。**
3. **动手运行**

### 2.3.2 提取序列

1. **准备作物所有的蛋白序列文件（or基因文件）**
2. **目的基因的ID**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/a3800be104f9f0200a54660a0ef61b11_1719497686_2938.jpg)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/9e8c0ecb5f170b2fc45b90b9fe6ca293_1719497686_9316.jpg)
3. **打开TBtools，**Fasta Extract or Filter (Qyick)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/0badc788c991aecc63a4d6f8f7eee45e_1719497686_9161.jpg)
4. **获得结果**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/1ad773b2bfae1c3390d2c7c5cfaf4022_1719497686_4245.jpg)

---

## 2.4 目的同源基因motif分析

### 2.4.1 使用MEME进行motif预测

1. **网址：**[https://meme-suite.org/meme/tools/meme](https://meme-suite.org/meme/tools/meme)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/460936450c12a042a8fcb6759e291bf4_1719497686_3602.jpg)

* **上传相关的fa文件，以及修改相关的参数，进行提交**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/30666b587b7897093aff5eb0ccab9bcb_1719497686_1892.jpg)
* **输出结果**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/edf1686b934fd47e921205e42d12c35f_1719497686_2979.jpg)输出结果很快，有以下几个结果文件。

### 2.4.2 motif可视化

**对于motifi分析可以参考一下文章：**

1. (https://mp.weixin.qq.com/s/7FvQ1iyLehQc7XXqFhP_vQ),TBtools开发者本人的教程
2. (https://mp.weixin.qq.com/s/QSjQnPjHQYrneTMKIbQsiA)
3. **或是本篇教程**

**MEME网址结果可以给我们的seqlogo信息和motif信息。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/f21ffc7b450216b8307313900e279ae3_1719497686_4315.jpg)

---

1. **Seqlogo**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/fd6a55f5113b26cc020a59528d2a4024_1719497686_5882.jpg)结果文件中就有seqlogo文件信息。也可以自己的下载后绘制。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/851cab6a43fa110bc430ccb2d8fa650a_1719497686_6253.jpg)按以下操作即可下载序列。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/945d2e47834531b31692404fdb166f08_1719497686_1876.jpg)也可以下载已有的seqlogo图片。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/86f7803da0a044c1c74d5f5fbc192520_1719497686_3443.jpg)下载后所有的motif序列信息。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/a1028cbfbf4841250ed39de7eee303a5_1719497686_2845.jpg)

---

1. **使用R语言对Seqlogo序列进行可视化这里借用这篇教程，**[基因结构及motif分析](https://mp.weixin.qq.com/s/zyTp5IraHNO2Caw33W3byA)。批量生产Seqlogo可视化。

**我们可以根据自己的motifi数量进行命名，我自己只有10个motif信息。所以命名为**motif1-10.txt**。**

```plain
## 加载所需要的包
library(ggplot2)
#BiocManager::install("ggseqlogo")
library(ggseqlogo)

## 批量生产文件名
filelist = c(paste0('motif',1:10,'.txt'))
filelen <- length(filelist)

##批量读取
data.list <- list()
for (i in 1:filelen) {
data.list[]=scan(filelist,what = '')
}

ggseqlogo(data.list,col_scheme="clustalx", ncol = 5)+
theme(axis.line = element_line(colour = 'black'),
   axis.text.x = element_blank(),
   legend.title = element_blank())

ggplot()+
geom_logo(data.list, col_scheme = "clustalx")+
theme_logo()+
facet_wrap(~seq_group,ncol = 5,scales = "free_x")+
theme(axis.line = element_line(colour = 'black'),
   axis.text.x = element_blank())
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/932445065de796e4a19072657d95502b_1719497686_2797.jpg)对比一下MEME网站中的图形。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/0e50775f4b6abcc774ebea4e6d948bd1_1719497686_7735.jpg)对于Seqlogo的绘制，美化，可以根据很多优秀的教程。在网上上一搜，都可以找到。

### 2.4.3 motif的分析

1. **下载结果文件**MAST XML output**，使用TBtools软件进行可视化。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/b9660d69d25ad4819df1fa726b493205_1719497686_9025.jpg)
2. **打开TBtools中的**Gene Structure View**,只需上传MEME中的XML文件即可，上传上去直接点击**Start**。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/27ccd0efa6afebab9720bfb750e0cc48_1719497686_4621.jpg)-- 操作：![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6c3c41813e29627438254d4cb65b3584_1719497686_4974.jpg)结果：![](data/attachment/forum/plugin_zhanmishu_markdown/202406/8057c7525bcfee5b6f56f1c5ea9a395d_1719497686_1296.jpg)保存！！

**注意：我们这里保存的时候最好保存为PDF或SVG格式，输出为矢量图****。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/ac59d7dca6e4eece721d26866be87d24_1719497686_5399.jpg)

**如果我们的教程只是到这里，那么就没有什么意义了。因为，类似非常优秀和详细的教程很多。绘制出图形是一方面、美化可是重头戏****。**

---

**在MEME输出文件中，也提供了motif的图形，也可直接使用。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/703e50cb8efe1c1cd9a589dbcf9fc189_1719497686_1450.jpg)

## 2.5 基因家族保守结构域分析

1. **使用**Batch CD-Search**进行预测，网址：**[https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi](https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2b996380a455e1cf4cbc3df739cb06f2_1719497687_7166.jpg)
2. **提交序列信息即可**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/7822de708ab287afbc46f308480875a3_1719497687_7041.jpg)
3. **Batch CD-search只支持目的基因****蛋白序列**信息, 以及序列数量少于1000。

**Warning: Batch CD-Search accepts only** **protein sequences****. The maximal number of query sequences per request is** **1000****. A single query sequence can not exceed a length of 40,000 residues.**

**可以提供你的邮箱，等运行结束后，直接发送到你的邮箱。如果序列较多，建议提供邮箱。**

1. **下载文件**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/325225ebe08c399ef56cac6c8654d7e2_1719497686_3505.jpg)结果文件：![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6e0d5645cd3e770d4a84982cf01f4d90_1719497686_9775.jpg)
2. **打开TBtools中的**Visualize NCBI CDD DOmainPattern![](data/attachment/forum/plugin_zhanmishu_markdown/202406/263d6a96c2b8fefe08370fe463e8c7cb_1719497687_2565.jpg)
3. **输入结果文件和fa文件**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2167292b9565806f4fdb788fdc29aa46_1719497686_2147.jpg)
4. **根据自己的需求进行调整即可。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2b200d615a46f3ebc309bd287b7e7b2c_1719497687_6709.jpg)
5. **输出文件。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/497d7b146e70d1a36cde02ee246551be_1719497687_7429.jpg)

## 2.6 进化树分析

**进化树分析，在基因家族中是必须的，以及在很多图中都是需要的。进化树分析和绘制，也有很多教程，参考**(https://mp.weixin.qq.com/s/aatJo0g7NSov5rIIjNr6uA)、或是你也可以使用MEGA来做分析。

### 2.6.1 iqtree+ggtree绘制进化树教程

**参考****：**(https://mp.weixin.qq.com/s/aatJo0g7NSov5rIIjNr6uA)

1. **iqtree获得树文件**

**所需软件**

1. **mafft**
2. **iqtree** **mafft安装** **我是使用服务器中运行的，安装可以使用conda**

```plain
conda install mafft
```

**iqtree官网**

```plain
http://www.iqtree.org/
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6c12d7afaab7a2e0525b23b5f7f19420_1719497687_3679.jpg)iqtree功能很强大，大家可以查看软件的官方文档。** ****安装**

```plain
conda install iqtree
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/86867f0dfa20448e069da0932cc7d9d3_1719497687_2949.jpg)软件安装好后直接运行即可。

1. **序列准备**

**进化树序列可以使用蛋白序列或核酸序列即可，格式按其准备即可。**

```plain
>B2LU34
MTSIAFWNAFTVNPFPAAARRSPPPLTPFTSGALSPARKPRILEISHPRTLPSFRVQAIAEDEWESEKKALKGVVGSVAL
AEDETTGADLVVSDLKKKLIDQLFGTDRGLKATSETRAEVNELITQLEAKNPNPAPTEALSLLNGRWILAYTSFAGLFPL
LGAESLQQLLKVDEISQTIDSEGFTVQNSVRFVGPFSSTSVTTNAKFEVRSPKRVQIKFEEGIIGTPQLTDSIVIPDKFE
FFGQNIDLSPFKGVISSLQDTASSVAKTISSQPPIKFPISNSNAQSWLLTTYLDDELRISRADGGSVFVLIKEGSPLLT
>B4F6G1
MTSIAFCNAFTVNPFLAAARRSPPPLTPLTSVALSPARKPRILAIFHPRTFPSFRVQAIAEDEWESEKKTLKGVVGSVAL
AEDEKTGADLVVSDLKKKLIDQLFGTDRGLKATSETRAEVNELITQLEAKNPNPAPTEALSLLNGKWILAYTSFVGLFPL
LGAESLQQLLKVDEISQTIDSEGFTVQNSVRFVGPFSSTSVTTNAKFEVRSPKRVQIKFEEGIIGTPQLTDSIVIPDKVE
FFGQNIDLSPFKGVISSLQDTASSVAKTISSQPPIKFPISNSNAQSWLLTTYLDDELRISRADGGSVFVLILESSPLLT
>O49629
MATVQLSTQFSCQTRVSISPNSKSISKPPFLVPVTSIIHRPMISTGGIAVSPRRVFKVRATDTGEIGSALLAAEEAIEDV
EETERLKRSLVDSLYGTDRGLSASSETRAEIGDLITQLESKNPTPAPTEALFLLNGKWILAYTSFVNLFPLLSRGIVPLI
KVDEISQTIDSDNFTVQNSVRFAGPLGTNSISTNAKFEIRSPKRVQIKFEQGVIGTPQLTDSIEIPEYVEVLGQKIDLNP
IRGLLTSVQDTASSVARTISSQPPLKFSLPADNAQSWLLTTYLDKDIRISRGDGGSVFVLIKEGSPLLNP
```

1. **mafft比对**

**使用mafft将序列对齐。**

```plain
mafft test.fa > test.aligend.fa
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/1d8e191b88c10429d3f2ea24c8daf9bb_1719497687_1310.jpg)我们获得对齐后的数据格式。

1. **iqtree构建树**

```plain
iqtree -s test.aligend.fa -m MFP -bnni -nt AUTO -cmax 15 -redo -bb 1000
```

**关于iqtree的使用，可以看这篇教程**(https://www.jianshu.com/p/fa057daadfbc)，讲的很详细。

**必须参数：**

```plain
-s 输入多序列比对文件
-nt 多线程，AUTO是自动多线程
-bb 1000 指定了要用快速BS法做1000次
```

**最终，我们可以获得以下结果文件。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/995854f27e1be3c5f74c7a8d74401fda_1719497687_5662.jpg)

---

1. **ggtree绘制进化树**

**这里，我们使用基迪奥的教程，**[如何绘制添加分类色块的进化树？](https://mp.weixin.qq.com/s/Smgl5CAtZI1xzw6_iOyJBQ),这个教程也是讲解得很详细。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6ba4edd37a4a24197c52daa0a4fc22b0_1719497687_9410.jpg)

---

**注意：我们这里使用iqtree输出文件**test.aligend.fa.treefile**作为输入文件。**

```plain
#载入相关的R包；
library(ggtree)
library(treeio)
library(ggplot2)
#读入newick格式的进化树文件；
tr = read.newick("test.aligend.fa.treefile")
ggtree(tr)
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/27730d23a6ead00a33a4aeefc2d5200b_1719497687_4267.jpg)

```plain
#为进化树添加叶标签；
p1 <- p0 + geom_tiplab(size=2,color="grey10")
p1
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/3d47b025653509472c8ef5d56a8546ec_1719497687_5392.jpg)

```plain
#为进化树添加圆形顶点；
p2 <- p0+ geom_tiplab(size=2,offset=0.03, color="grey10")+
geom_tippoint(color="#6bc72b",fill="#6bc72b",
alpha=0.4, size=3,shape=21)
p2
```

![](data/attachment/forum/plugin_zhanmishu_markdown/202406/199ffb9d0b3ffd11c1c5587e049cb09d_1719497687_8521.jpg)

**后面的教程参数调整，按着教程即可**[如何绘制添加分类色块的进化树？](https://mp.weixin.qq.com/s/Smgl5CAtZI1xzw6_iOyJBQ)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/4d3a01b7878cb1fe3e270add459a21a1_1719497687_9908.jpg)

### 2.6.2 MEGA制作进化树

**此部分内容来自：**(https://mp.weixin.qq.com/s/QSjQnPjHQYrneTMKIbQsiA) **输入数据为目标基因家族的蛋白质序列。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/f5f016c99b6afaf2bc29af51590df3da_1719497687_9708.jpg)

**先进行多序列比对，用MUSCLE默认参数。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/9845cf644e2c13f52668e9862727b769_1719497687_9820.jpg)图片将比对好的结果保存为.meg格式。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/89483cd21279af161658ca426952666a_1719497687_9884.jpg)重新打开比对后的文件，构建进化树，使用最大似然法，根据需要选择建树方法。再构建之前可以进行模型的预测，这里节省时间直接使用默认参数。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2bebf51e1978086ff8019317b293b9bc_1719497687_1435.jpg)

**现在就构建好了一棵进化树，导出为.nwk格式。接下来最后一步就是再TBtools中展示所有结果。**

..................................后续教程还有........................................................................................

# 原文链接：[基因TBtools做基因家族分析 | 生信部分](https://mp.weixin.qq.com/s/brDV1v4Y5cUWylbB7Wvb1w)

**若我们的教程对你有所帮助，请**点赞+收藏+转发**，这是对我们最大的支持。**

### 往期部分文章

**「1. 最全WGCNA教程（替换数据即可出全部结果与图形）」**

* (https://mp.weixin.qq.com/s/M0LAlE-61f2ZfpMiWN-iQg)
* (https://mp.weixin.qq.com/s/Ln9TP74nzWhtvt7obaMp1A)
* (https://mp.weixin.qq.com/s/rU76rLG4AayuiHbDhgOGBg)
* (https://mp.weixin.qq.com/s/Ot2h3LH82vfg4m7YLG8e0w)
* (https://mp.weixin.qq.com/s/ca8_eqirjJYgC8hiaF8jfg)

---

**「2. 精美图形绘制教程」**

* [精美图形绘制教程](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzAwODY5NDU0MA==&action=getalbum&album_id=2614156000866385923&scene=173&from_msgid=2455848496&from_itemidx=1&count=3&nolastread=1#wechat_redirect)

**「3. 转录组分析教程」**

* **「**[转录组上游分析教程[零基础]](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzAwODY5NDU0MA==&action=getalbum&album_id=2870608342451224581&scene=126&uin=&key=&devicetype=Windows+10+x64&version=63090719&lang=zh_CN&ascene=0)**」**
* **「**[一个转录组上游分析流程 | Hisat2-Stringtie](https://mp.weixin.qq.com/s/A4cFpkrKGqPeESVQl69jcA)**」**

**「4. 转录组下游分析」**

* [批量做差异分析及图形绘制 | 基于DESeq2差异分析](https://mp.weixin.qq.com/s/aIiR5v1olhv7bMkrZjfddQ)
* (https://mp.weixin.qq.com/s/NeHjQk9DEWtx5hGOJhWuZw)
* [单基因GSEA富集分析](https://mp.weixin.qq.com/s/g8ZWgSIIw_6fZimFLmRMng)
* [全基因集GSEA富集分析](https://mp.weixin.qq.com/s/BbkdplN6tHT_tHGEKPABhQ)

**「小杜的生信筆記」** ，主要发表或收录生物信息学教程，以及基于R分析和可视化（包括数据分析，图形绘制等）；分享感兴趣的文献和学习资料!!

页: [1]

ResBang生信交流网's Archiver

基于TBtools做基因家族分析 | 生信部分 | 一