基于TBtools做基因家族分析 | 生信部分 | 三
# **原文链接:[基因 TBtools 做基因家族分析 | 生信部分](https://mp.weixin.qq.com/s/brDV1v4Y5cUWylbB7Wvb1w)**---
# [基于 TBtools 做基因家族分析 | 生信部分 | 一](https://www.resbang.com/thread-243-1-1.html)
# [基于TBtools做基因家族分析 | 生信部分 | ]()二
---
![](data/attachment/forum/plugin_zhanmishu_markdown/202406/d3688f6b5514b140cc2170943d77b911_1719498252_2593.jpg)
**「一边学习,一边总结,一边分享!」**
# **原文链接:[基因 TBtools 做基因家族分析 | 生信部分](https://mp.weixin.qq.com/s/brDV1v4Y5cUWylbB7Wvb1w)**
# **三、IA图形美化**
**美化,我罗列出单个章节进行讲解。表明,是很重要的。以及,图形的美化,需要不断学习和模范大牌期刊的图形类型,以及自己要时刻进行总结和创新。对于创新,这个就比较玄学,每个人的审美不同,逻辑不同,关注点不同.......导致最终看到的点也不同。因此,我们在不是很离谱的创作中,结合自己的审美进行美化即可。****我们要坚信:审美。首先要符合自己,其次,再考虑别人。**只有自己先认同,你才有可能让其他人也认同!
## 3.1 使用工具
**1.推荐使用的工具****:AI、PS**
**如果不知道类似软件的,自己百度。**
1. **如何安装**
* **有钱人:购买正版**
* **穷人(和我一样):薅羊毛,使用破解版**
1. **如何获取安装包**
**在本公众号中回复关键词获得。**
* **PS安装包关键词:**PS
* **AI安装包关键词:**AI
**或是你自己寻找相关版本的安装包即可。**
**提示:**请自己输入正确的关键词(每次看到有些同学们的关键词,真的很无语......)
---
## 3.2 实际操作
![](data/attachment/forum/plugin_zhanmishu_markdown/202406/816db2e02ec04b39829ad092224ae1c0_1719498210_7065.jpg)
1. **打开AI,新建图层**A4
2. **导入进化树,适当调整进化树的宽度和字体大小**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/850ce338f3c22a0d2e4a8be2a25e87ce_1719498210_3201.jpg)
3. **依次导入的目的基因的motif、基因结构域等图形。并依次按进化树基因名进行排序即可。**
4. **为后期的图形的整齐性,我们使用参考线进行对齐,便于后期的调整。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/047319de219233f2c693eae1930aaaa4_1719498210_7307.jpg)**注意:这里看到我们的motif的图形颜色很难看,这就是前期没有考虑颜色的结果。因此,我一直强调,文章图形颜色统一的重要性,图形颜色搭配合理,你的论文已经成功1/3了。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/8d585ea09964d730b9e04a0637757877_1719498210_2873.jpg)换一种颜色就感觉好多了呀。
5. **添加基因结构图**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/f0c71605ac383ab95773f4bbd009b721_1719498210_3430.jpg)添加图形的操作都是一样的,不做多赘述。
6. **如何美化 对于美化,每个人的要求不一致,只要符合你的审美即可。我们在这里就直接添加渐变色。**
7. **新建一个图层 新建图层置于最底层。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/f47e55e1088b14b441f9a65d3365e905_1719498210_5225.jpg)
8. **选择图形工具**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/de4e1b318ad6e433cbc81497f95eaf8a_1719498210_1058.jpg)
9. **利用进化树的分支,将其进行分类**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/d3c457f235890bf8205f21335397d090_1719498210_7890.jpg)
10. **填充颜色(根据自己的喜好)**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/17559be646aee4db0f437284cfb47912_1719498210_3237.jpg)
11. **更改透明图**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/1c7f2971af6652d34f6bd5bf815bb35d_1719498210_1623.jpg)
12. **渐变色**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/ce897734bfd310dc77695dced7d2dda8_1719498210_6930.jpg)
* **不透明度:60**
* **中间位置:10-50% 结合实际情况调节。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/25930c47932d8f682d76ecdb10008154_1719498210_9973.jpg)
1. **最后图形**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/3fa78381cbe7064239a190db644b01ef_1719498210_3990.jpg)图形很多细节需要自己耐心调节,这里只是做示范,相对比较粗糙。
# **四、多物种共线分析**
**共线分析依旧是使用TBtools,哈哈哈哈,做基因家族TBtools可以帮你完成80%的生信分析。毫不夸张!!!!! TBtools共线分析的教程很多,我们以**[零基础多物种间共线性分析](https://mp.weixin.qq.com/s/53tq6H8OX5M24IKkFkSMFw)教程作为参考(也不是作为参考了,是直接按他的步骤进行操作)。其他参考教程:[全基因组共线性分析](https://mp.weixin.qq.com/s/5Qp8Yk7Te3X1z5WQGhu_SQ)、[无限个!物种共线性分析结果可视化](https://mp.weixin.qq.com/s/2sXn85RtVvhLKBvohVXnTA)、[任何人!一键完成物种间的共线性分析与可视化](https://www.jianshu.com/p/f39bff6c4746)。
## 4.1 需要文件
1. **参考基因组fa文件**
2. **注释文件GFF or GTF**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/25c4d2359dd5042028d4917e9d0199a7_1719498210_9463.jpg)
**TBtools可以对无限个作物进行共线分析,牛!!!**
## 4.2 染色体统一命名
**在这个教程中,有这样的一个步骤,如果你需要,你就进行操作。**
1. **gtf文件进行ID prefix**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/de181a336e6349ac0aa27881085e0b10_1719498210_3148.jpg)
2.
![](data/attachment/forum/plugin_zhanmishu_markdown/202406/b2cf8bbf881665de9e13c7180029ec27_1719498210_7467.jpg)3. fa文件进行ID prefix![](data/attachment/forum/plugin_zhanmishu_markdown/202406/9031e20b07b54fd33d12ffb87cf55675_1719498210_3299.jpg)
## 4.3 实操
1. **打开**one step MCScanx**小程序**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/7d3a28d534e46d62ed9930f63e96a1b8_1719498210_4118.jpg)
2. **输入两个作物的文件信息**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/c7b87954e7175f341100a1cb73b14b28_1719498210_4807.jpg)
3. **点击开始**Start
4. **如果是多个作物,那么依次进行两两比较。比如:共线结果是以这样的顺序:Tomato-LA-Arabidopsis**
**比对顺序:**
* **Tomato-LA**
* **LA-Arabidopsis**
1. **比对结果GFF文件合并**
* **打开**Text Merge for MCScanX**程序**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6c6c521e8ea29d1818f5fcb89edee4dd_1719498210_9147.jpg)合并多个的MCScanX的结果文件中的GFF文件![](data/attachment/forum/plugin_zhanmishu_markdown/202406/060e1568beaaf371ce5e1da66cb5f0d6_1719498210_1524.jpg)拖拽文件![](data/attachment/forum/plugin_zhanmishu_markdown/202406/7ec48c41b262fd783437be1d0797d93b_1719498210_2774.jpg)
**6.比对结果**ChrLayout.tab.xls**文件合并**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/7c1771bfc3e53e364a4ac60f06f914bd_1719498210_5846.jpg)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/f9eb771775d3dfa7f0efb1f171565ab1_1719498210_9888.jpg)7. 比对结果**geneLinks.tab.xls**文件合并![](data/attachment/forum/plugin_zhanmishu_markdown/202406/538355cb8972f84904a55beb93e54399_1719498210_4813.jpg)同上操作! 8. 合并文件 最终获得以下3个文件,用于绘制图形。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/b08b47248ea40f5914a6757d4351dc59_1719498210_9064.jpg)9. 要在共线中显色的基因ID
```plain
Solyc03g062790.3.1
Solyc10g018590.2.1
Solyc01g104320.4.1
Solyc03g083420.4.1
AT4G22240.1
AT2G35490.1
AT1G51110.1
AT5G53450.3
........
```
1. **绘图。打开**Multiple synteny plot![](data/attachment/forum/plugin_zhanmishu_markdown/202406/8b4d357217b9e8340290775bfc3fdcd6_1719498210_1842.jpg)输入参数![](data/attachment/forum/plugin_zhanmishu_markdown/202406/3b978a554000d2120db233b1c70f132c_1719498210_6251.jpg)输出图形![](data/attachment/forum/plugin_zhanmishu_markdown/202406/17a937cbad9b852daa0f838c07ce1fb4_1719498210_6462.jpg)
---
**注意,在输出图形中,我们可以看到作物染色体位置是有改变的。那么,如何更改呢?回答:直接更改Chr文件即可。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6045a4856345867767efaee1aa8bbd8f_1719498210_7507.jpg)更改这里的顺序即可!
# **五、同源目标基因元件预测**
**目标基因的元件预测,我们这里主要介绍使用两个网站进行。**
## 5.1 提取目标基因上游2000bp
**参考教程**[顺式作用元件预测和新的可视化方式](https://mp.weixin.qq.com/s/Z_jDmAWqU8MaQtFRM-thlQ)、[植物启动子-顺式作用元件-批量提取-预测-可视化分析](https://mp.weixin.qq.com/s/EfGUnjfv2o5L6ikxJqIDOQ),同样是使用TBtools操作。
1. **需要文件**
* **作物参考基因组fa文件**
* **注释文件GFF or GTF**
* **目标基因ID**
1. **直接使用TBtools中的**Gtf /Gff3 Sequences Extractor**获得每个基因的fa序列**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/65d30726fd33270569a7652863234de2_1719498210_1440.jpg)输出文件![](data/attachment/forum/plugin_zhanmishu_markdown/202406/cfa1ecad5d9634f2b2dbf9bb0e379f48_1719498210_4316.jpg)点击**Initalize**,选择**CDS**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/0966f8962aee37ec457ddb843701fa22_1719498210_3160.jpg)选择上游2000bp的fa序列![](data/attachment/forum/plugin_zhanmishu_markdown/202406/644d2ab47d06b51adeefb6c0d822d306_1719498210_7402.jpg)
2. **目标基因的fa序列,打开**Fasta Extract or Filter (Quick)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/22ba364b2ea9714f409cfb8989b9b02d_1719498210_8920.jpg)输出结果文件:![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6900f086acf06774b7f9003e994a6ab1_1719498210_9026.jpg)
3. **查看信息是否正确,打开**Fasta Stats![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2a6dcb473465b4b276bdba57ba47c44f_1719498210_4445.jpg)
4. **转换序列(全部为大写),打开**Sequence Manipulate (Rev&Comp![](data/attachment/forum/plugin_zhanmishu_markdown/202406/5808f1d6b956060d493cfc33c5ec5a56_1719498210_2932.jpg)
## 5.2 提交预测网址进行顺式作用预测
**预测,这里使用两个网站进行预测,分别是**PlantCare**和**PLCAE**。**
### 5.2.1 使用Plantcare进行预测
**网址:**[http://bioinformatics.psb.ugent.be/webtools/plantcare/html/](http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/a9443eb622ac57974c9e6e7f70a21d0c_1719498210_3659.jpg)
1. **上传序列后,Plant可以提供你自己的邮箱,运行结束后,结果直接发送到你的邮箱中。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/8705b3e7bfe996eb2f9cfc7b1985cc66_1719498210_3836.jpg)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/dba06d1aa255dc4c2ba7c760819996b4_1719498210_2771.jpg)
2. **邮箱中获得结果,根据你的序列多少,10分钟以上吧!**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/03d4a7c6a0f941bd9cd3e88ddec8ec91_1719498210_1627.jpg)
3. **结果**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/e74d8e6aa28a4a95b3d2f5cf16c395d0_1719498210_4349.jpg)
4. **使用execl打开后**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/4c08eee450073f51273cf25907d34929_1719498210_4739.jpg)
```plain
1. 基因ID;
2. 顺式作用元件名称;
3. 顺式作用元件序列;
4. 顺式作用元件的起始位置;
5. 顺式作用元件的长度;
6. 顺式作用元件所在的链的方向;
7. 物种名;
8. 顺式作用元件所在的功能分类;
```
**删除某些不需要的结果:** **需要删除:**
```plain
1. 剔除第2列为空的行
2. 剔除第2列为unnamed的行
3. 最后一列,无功能作用的
```
**具体删除的数据,根据自己的分析来做。**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/1ac6969fd1e17164666104120ffbc355_1719498210_5642.jpg)最后,可以删除掉1000行以内
**-- 来自**[顺式作用元件预测和新的可视化方式](https://mp.weixin.qq.com/s/Z_jDmAWqU8MaQtFRM-thlQ),这个意见有重要的参考意义。如果不合并,导致元件的作用太多,绘制出的图形颜色太杂,且不好看。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/037bc3c8acbcab7d5e9ffebb4378e425_1719498210_2337.jpg)5. 绘图![](data/attachment/forum/plugin_zhanmishu_markdown/202406/9efbf1a28caedaec5d2e74ce16c3cb4c_1719498210_6124.jpg)绘图前还需要准备基因的长度文件![](data/attachment/forum/plugin_zhanmishu_markdown/202406/d7dfad6ce439ac5441b42fe96c03334f_1719498210_2352.jpg)输入数据,设置参数![](data/attachment/forum/plugin_zhanmishu_markdown/202406/6f8b40c9d9b2551b199e6d6f179c8529_1719498210_9836.jpg)结果:![](data/attachment/forum/plugin_zhanmishu_markdown/202406/c9c382be73477c19acec460dd6f090df_1719498210_9867.jpg)在TBtools中也可以输入进化树文件。![](data/attachment/forum/plugin_zhanmishu_markdown/202406/82bb6936568560355b0ee77dcdca4f9f_1719498210_4362.jpg)
---
**我们这里也可以使用的起那么AI中的呢进化树进行模板进行美化。**
### 5.2.2 PLACE进行预测
**网址:**[https://www.dna.affrc.go.jp/PLACE/?action=newplace](https://www.dna.affrc.go.jp/PLACE/?action=newplace)![](data/attachment/forum/plugin_zhanmishu_markdown/202406/e87790dd3e381786d8c90ef7c3a7e811_1719498210_2578.jpg)
* **缺点:PLACE一次最大只能输入20条基因序列,有一定的限制性。获得结果为网页版,如要整理,只能手动整理或使用脚本进行整理。**
* **优点:速度快!**
1. **获得结果**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/2e9e23529d689e3b44ab18bc175dec44_1719498210_5060.jpg)每个基因为单独的,需要自己整理。
* **只给元件名称、开始位置、序列、功能(SITE,需要点击进去才可以看到)**
* **整理,单独粘贴复制到execl中,并使用脚本进行整理。**
---
**选择哪个网站进行预测,取决于自己。只要结果符合我们自己的预期结果即可!!!**
---
### 5.2.3 热图可视化
**输入数据格式如下(可以根据自己的情况筛选):**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/79e16407225702f9eb0174e065359938_1719498210_7580.jpg)脚本:
```plain
install.packages('tidyverse')
intall.packages('RColorBrewer')
# 加载包
library(tidyverse)
library(RColorBrewer)
# 1.读取数据
df <- read_tsv('data.txt', col_names = F) %>% select(1,2)
# 2.整理数据
tidy <- df %>%
group_by(X1, X2) %>%
summarise(number = n()) %>%
arrange(desc(number))
# 3.查看数量分布,确定配色个数
summary(tidy$number)
# 最大值为9,所以下面的代码 hcl.colors(9, "RdYlGn")中为9
# 4.画图
ggplot(tidy, aes(x = X2, y = X1, fill = number)) +
geom_tile(color = 'black') +
geom_text(aes(label = number),col='black',cex = 1.5) +
scale_fill_gradientn(colors = rev(hcl.colors(9, "RdYlGn"))) +
scale_x_discrete(position = "top")+
theme_bw() +
theme(axis.text.x = element_text(angle = 90, hjust = 0),
axis.title = element_blank(),
axis.text = element_text(size = 7, color = 'black'))
```
![](data/attachment/forum/plugin_zhanmishu_markdown/202406/cee80e9823681ef9c979641064d8eb36_1719498210_1251.jpg)
```plain
# 通过修改 scale_fill_gradientn参数给每一个值指定颜色
cc <- c('#d9d9d9', '#f7fcb9', '#d9f0a3', '#addd8e', '#78c679', '#feb24c', '#fd8d3c', '#fc4e2a', '#b10026')
ggplot(tidy, aes(x = X2, y = X1, fill = number)) +
geom_tile(color = 'black') +
geom_text(aes(label = number),col='black',cex = 2.5) +
scale_fill_gradientn(colors = cc) +
scale_x_discrete(position = "top")+
theme_bw() +
theme(axis.text.x = element_text(angle = 90, hjust = 0),
axis.title = element_blank(),
axis.text = element_text(size = 7, color = 'black'))
```
![](data/attachment/forum/plugin_zhanmishu_markdown/202406/53131d1879d1f24baa0953ac50fcd0ce_1719498210_2177.jpg)
### 5.2.4 美化
**基于AI进行美化,方法同上**![](data/attachment/forum/plugin_zhanmishu_markdown/202406/f7d8b6f0f0657c706ee11f11ad9416f3_1719498210_1119.jpg)
---
# **六 ENDING**
**说实话,基因家族的文章分析确实消耗的时间和精力不算是很多。生信部分就差不多这些吧!再加上一些组学的数据来验证即可。除了生信的部分,剩余就是实验来验证,将两者进行结合,好一点的文章也可以发。我自己前面没有接触过基因家族的分析,因此,本次就是现学现做,做的还是比较简单。**
**本次来接触基因家族的分析,感触最深的就是,TBtools真的很强大。基因家族的分析、画图都可以使用它来完成。不得了啊,真的是将做生信的门槛一降再降,点赞点赞**
---
**本期内容是自己的做了一个整理,算是“教程搬运工”,也是自己在做分析后做的总结。自己不知道,这次分析后,多久以后还能涉及基因家族的分析。总结总结!! 但是,说实话!这个总结也花费自己很长的时间,如果你想获得这个教程的文本文档,可以“喜欢点赞,支持”,我在后台看到后会第一时间将文档链接发给你!!**
**若我们的教程对你有所帮助,请**点赞+收藏+转发,这是对我们最大的支持。
# **原文链接:[基因 TBtools 做基因家族分析 | 生信部分](https://mp.weixin.qq.com/s/brDV1v4Y5cUWylbB7Wvb1w)**
### 往期部分文章
**「1. 最全WGCNA教程(替换数据即可出全部结果与图形)」**
* (https://mp.weixin.qq.com/s/M0LAlE-61f2ZfpMiWN-iQg)
* (https://mp.weixin.qq.com/s/Ln9TP74nzWhtvt7obaMp1A)
* (https://mp.weixin.qq.com/s/rU76rLG4AayuiHbDhgOGBg)
* (https://mp.weixin.qq.com/s/Ot2h3LH82vfg4m7YLG8e0w)
* (https://mp.weixin.qq.com/s/ca8_eqirjJYgC8hiaF8jfg)
---
**「2. 精美图形绘制教程」**
* [精美图形绘制教程](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzAwODY5NDU0MA==&action=getalbum&album_id=2614156000866385923&scene=173&from_msgid=2455848496&from_itemidx=1&count=3&nolastread=1#wechat_redirect)
**「3. 转录组分析教程」**
* **「**[转录组上游分析教程[零基础]](https://mp.weixin.qq.com/mp/appmsgalbum?__biz=MzAwODY5NDU0MA==&action=getalbum&album_id=2870608342451224581&scene=126&uin=&key=&devicetype=Windows+10+x64&version=63090719&lang=zh_CN&ascene=0)**」**
* **「**[一个转录组上游分析流程 | Hisat2-Stringtie](https://mp.weixin.qq.com/s/A4cFpkrKGqPeESVQl69jcA)**」**
**「4. 转录组下游分析」**
* [批量做差异分析及图形绘制 | 基于DESeq2差异分析](https://mp.weixin.qq.com/s/aIiR5v1olhv7bMkrZjfddQ)
* (https://mp.weixin.qq.com/s/NeHjQk9DEWtx5hGOJhWuZw)
* [单基因GSEA富集分析](https://mp.weixin.qq.com/s/g8ZWgSIIw_6fZimFLmRMng)
* [全基因集GSEA富集分析](https://mp.weixin.qq.com/s/BbkdplN6tHT_tHGEKPABhQ)
**「小杜的生信筆記」** ,主要发表或收录生物信息学教程,以及基于R分析和可视化(包括数据分析,图形绘制等);分享感兴趣的文献和学习资料!!
页:
[1]