数据科学工厂 发表于 2024-6-7 23:08:04

TAD calling 之 insulation score 分析

动动发财的小手,点个赞吧!

## 1. 导读

本文主要对`insulation score` 的提出与计算方法进行简要的介绍,并展示一个计算`insulation score` 的过程。

## 2. 定义

`insulation score` 是(https://github.com/dekkerlab/crane-nature-2015 "dekker")实验室在2015年发表于`Nature`上的(https://www.nature.com/articles/nature14450#citeas "Nature")文章中提出的,其主要用于`TAD`相关的分析与表征,目前`insulation score`主要用于识别`TAD`

## 3. 计算方法

### 3.1. 计算`insulation score`

![计算过程动画](https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220923211258399.png)

```
在给定的区域内,沿着互作矩阵的对角线,以一个正方形的滑动窗口,从上至下滑动,计算每个窗口内互作程度值的总和。
```


```
这些
```

`bin`之间存在这很强的`insulation`现象,例如在`TAD`的边界,这些区域的`insulation score` (根据`insulation square测定`)很低。

```
那些互作程度较高,比如
```

`TAD`内部的区域,它们的`insulation score` 很高。

```
这些
```

`insulation score` 很低的区域,可能就是潜在的`TAD`边界。

### 3.2. `insulation score`标准化

![标准化公式](https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220923221454862.png)

>> ISavg: 是所有`IS`值的平均值
>>

### 3.3. 计算每个`bin`的`delta`值

!(https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220923220522027.png)

```
将每个
```

`bin`的互作强度值作为`value`,画出其在染色体上的波动曲线,波谷处就是需要识别的边界。为了识别出黑色曲线中的波谷,方法中又定义了一个`window`,对每个`bin`内的`insulation`值计算`delta`值,最终红色曲线中经过X轴的坐标即为`insulation score`值曲线的波谷,也就是TAD边界的位置(从上图可以看到,红色曲线穿过0刻度线的点,对应的就是黑色波动曲线的波谷)。

### 3.4. 计算`TAD`边界

```
由于该方法计算的是
```

`TAD`的边界位置,因此`TAD domain`的位置区域,需要进一步的转换,才能得到。

## 4. [公式总结](https://www.jianshu.com/p/fd39eeaf1e75 "公式")

![公式总结](https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220923221915557.png)

## 5. 实战

下面介绍如何用(https://fan-c.readthedocs.io/en/latest/index.html "FAN-C")计算`insulation score`

### 5.1 install

```sh
pip install fanc -i https://pypi.tuna.tsinghua.edu.cn/simple
```

- 推荐使用`conda`进行安装

```sh
conda create -n fanc python=3.7
conda activate fanc
conda install fanc
```

### 5.2. example

- 计算

利用不同的windows size计算`insulation score`

```sh
fanc insulation ./example.hic ./example.insulation \
-w 1000000 1500000 2000000 2500000 3000000 3500000 4000000 \
-o bed# 输出bed 格式
```

- `TAD`强度变化图

`TAD`边界强度变化图,大体上可以反映TAD之间隔绝情况,绝缘系数越低,`TAD`之间交互越弱。

![边界强度变化图](https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220920193803833.png)

- 绘图

```sh
fancplot -o ./insulation.png chr18:18mb-28mb \
-p ./example.hic -m 4000000 -vmin 0 -vmax 0.05 \
-p ./example.insulation
```

![](https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220923223000207.png)

- 曲线图

```sh
fancplot --width 6 -o ./example.png \
chr18:18mb-28mb -p triangular ./example.hic -m 4000000 \
-vmin 0 -vmax 0.05 -p line ./example.insulation_1mb.bed \
./example.insulation_2mb.bed -l "1mb" "2mb"
```

!(https://swindler-typora.oss-cn-chengdu.aliyuncs.com/typora_imgs/image-20220923223214124.png)

>> 有任何问题,欢迎大家评论区留言,或者私信小编。
>>
>
页: [1]
查看完整版本: TAD calling 之 insulation score 分析