如何用 Cytoscape 提升文章档次?

2016-12-23 18:07 来源:小张聊科研 作者:机智的怪阿姨
字体大小
- | +

本文授权转载自微信公众号「小张聊科研」,微信 ID:xzlky2015。

大家好,万众期待的怪阿姨开脑洞时间又到了。

做完 microRNA 芯片测序之后预测 microRNA 的靶基因,筛选重要的靶基因进行验证是研究中的常见套路,做出结果后写到文章 Result 里大致如下。

264007155825337431.jpg

如果我是审稿人,看到这么干巴巴的一段话肯定心情烦躁。故而该文作者增加了 Figure 3。这样的一张图放在 2-3 分的文章里是加分极多的。

18.jpg

这种简洁明了的 microRNA-mRNA 关系表达正是 Cytoscape 的强项。下面本宫就来画一个!

先在 Pubmed 上找了一个 microRNA 的数据包 GSE72199[2],GEO2R 筛选了差异表达的 microRNA:

215.jpg

随便找了 P 值最小的 5 个,然后去 TargetScan(http://www.targetscan.org/)上进行了靶基因预测。(如果确实需要进行靶基因预测并进行验证的话,还是需要多个工具一起使用取交集的,常用的有 TargetScan、Mirtrail、Mirdb 和 MiRbase 等)

3749.jpg

筛选 Cumulative weighted context++ score ≤-0.4 的靶基因,做成如下的 EXCEL 表格:

4268.jpg

再将 EXCEL 表格中的内容复制到 TXT 文本中,导入 Cytoscape:

5829158434.jpg636908.jpg

将第一列选择为 Source Nodes,导入后得到下图:

764.jpg

按住 SHIFT 和鼠标左键画框,把太远的 Nodes 拖得聚拢一些,不然太占地方了:

863.jpg

处理好了之后,我们需要对 Nodes 和 Edges 进行个性化的标注。Nodes 的注释这里分为两类:1、mRNA 还是 microRNA;mRNA 的颜色随 Cumulative weighted context++渐变。Edges 的注释为:作用关系随 Cumulativeweighted context++ score 渐变(可以是颜色也可以是线条粗细)。

首先导入 Table 文件,还是之前那个 TXT 文件:

10038409.jpg

选择设置 Nodes 的颜色,Column 选择 Cumulative weighted context++ score,颜色选成渐变,然后编辑色阶

11123477.jpg

小三角设置色阶颜色,Handle Postion 设置色阶对应的数值,Add 增加色阶数量。(这里需要注意一点,Cumulative weighted context++ score 的最小值是-66.01,最大值是-0.4,我们设置的范围略宽于这个范围为好,保证每个 Nodes 的颜色都能正常显示)

然后再编辑形状,mRNA 选择圆形,microRNA 选择菱形。

之后再编辑 Edges 的颜色:

12289265568.jpg

选择设置 Edges 的颜色,Column 选择 Cumulative weighted context++ score,颜色选成渐变,然后编辑色阶。

1337328.jpg

做完是这样的:

144.jpg

最后效果如下:

1556.jpg

当然了,我们还可以设置和 2 个 microRNA 相关的 mRNA 的圆圈大小,从而更进一步突出我们的筛选结果。

下面我们讲一讲从 STRING 数据库(http://www.string-db.org)得到分析结果之后的作图。

首先从 GEO 上找了两个数据包,分别筛选差异基因再取交集,一共得到 163 个差异基因,丢到 STRING 数据库里进行分析:

16649792.jpg

得到下面的图,下载下面标注的那个 TXT 文档,导入到 Cytoscape 里:

1775898463.jpg

导入后得到下面的图:

188005184.jpg

假设我们比较关注以 CCND1 为中心的 Network,我们先把别的不相关的都删掉,再调整下各个 Nodes 的位置:

19929.jpg

这里我们对 Nodes 和 Edges 的作出如下注释:1、Edges 的粗细由 combined_score 渐变调整;2、mRNA 的上下调分别注释为粉色和黄色;3、Nodes 的大小由相互作用的 Count 数决定。

首先选择 Tool 里的 Network Analysis 工具中的 Generate Style from Statistics:

200056.jpg

如下图粗细做好了,然后做 Nodes 的颜色和大小:

21118.jpg

将 TXT 文件复制到 EXCEL 里处理一下,需要对 Nodes1 增加 Count 和 Regulation 两列的注释(Regulation 也可以根据 Fold Change 的数值进行颜色渐变处理)。

Count 的计算如下图,将 Nodes1 和 Nodes2 复制到一列中,然后利用 = COUNTIF(A:A,A2) 的公式进行计算

233338858.jpg

增加上下调关系,然后选中第一列删除重复项,将处理完的数据保存为 TXT 文件作为 Table 导入到 Cytoscape 中(这里要注意的是还要添加一列 Nodes2 将其注释进去):

244875.jpg

根据 Regulation 调整节点颜色,根据 Count 渐变调整 Nodes 大小。调整完结果如下:

255742.jpg

小结:Cytoscape 主要是通过 Edges 连接 Nodes 构成 Network,通过导入 Table 对 Network 中的 Edges 和 Nodes 进行注释,从而得到我们想要的效果,导入的 Table 则源于我们对数据的处理,所以数据的处理分析是 Cytoscape 作图的重要前提。好了,今天 Cytoscape 的作图就扯到这了,以后会给大家讲讲 CO-EXPRESSION 的作图。

1. Pahl, M.C., et al., MicroRNA expression signature in humanabdominal aortic aneurysms. BMC Med Genomics, 2012. 5: p. 25.

2. Mokutani,Y., et al., Down-Regulation ofmicroRNA-132 is Associated with Poor Prognosis of Colorectal Cancer. AnnSurg Oncol, 2016. 23(Suppl 5): p.599-608.

编辑: 冯宁

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。