網(wǎng)絡(luò)圖是生物信息學(xué)中常用的顯示不同節(jié)點(diǎn)之間關(guān)聯(lián)方向與關(guān)聯(lián)程度的可視化方法。在富集分析中,網(wǎng)絡(luò)圖常被用于表示功能與估計(jì)到該功能的基因的聯(lián)系。在蛋白質(zhì)互作用網(wǎng)絡(luò)中,網(wǎng)絡(luò)圖常用于表示編碼基因之間的互作用類型與作用強(qiáng)度,基于這些信息,還可以通過某一節(jié)點(diǎn)與其他節(jié)點(diǎn)的連接數(shù)量來判斷該節(jié)點(diǎn)在整個(gè)網(wǎng)絡(luò)中的貢獻(xiàn)度(degree)。繪制網(wǎng)絡(luò)圖常使用cystoscape軟件,通過輸入符合規(guī)范的數(shù)據(jù),調(diào)整合適的參數(shù),就可以得到一張包含多樣化信息的網(wǎng)絡(luò)。本文將從結(jié)果解讀開始,先介紹網(wǎng)絡(luò)圖中常可以展示的信息類型,再介紹如何準(zhǔn)備數(shù)據(jù)和調(diào)整參數(shù)。
1. 結(jié)果解讀
這張圖中包含的信息有:
1. 12個(gè)節(jié)點(diǎn)的對(duì)應(yīng)關(guān)系
2. 不同節(jié)點(diǎn)有不同的顏色,代表所屬組別,是定性屬性
3. 不同的節(jié)點(diǎn)有不同的大小,代表某種定量屬性
4. 不同連接線有不同的顏色,代表對(duì)應(yīng)的互作用關(guān)系的作用類型,是定性屬性
5. 不同連接線有不同的寬度,代表對(duì)應(yīng)的互作用關(guān)系的作用強(qiáng)度,是定量屬性
2. 數(shù)據(jù)準(zhǔn)備
2.1 必需元素
如前所述,網(wǎng)絡(luò)圖是表示節(jié)點(diǎn)及其連接關(guān)系的圖,因此,節(jié)點(diǎn)和對(duì)應(yīng)關(guān)系是網(wǎng)絡(luò)圖的必需元素,也就是表格中的A列和B列??梢钥吹?,有節(jié)點(diǎn)A1-A11均與節(jié)點(diǎn)B存在關(guān)聯(lián),反過來,節(jié)點(diǎn)B和節(jié)點(diǎn)A1-A11存在一對(duì)多的關(guān)系。
2.2 節(jié)點(diǎn)連接關(guān)系
既然節(jié)點(diǎn)之間存在連接關(guān)系,那么如何定義這種關(guān)系呢?在這里,我們使用了兩個(gè)信息來描述,即C列的作用強(qiáng)度和D列的作用方向。作用強(qiáng)度通??梢杂蓴?shù)據(jù)庫給出,作用方向是使用-1表示負(fù)相關(guān),1表示正相關(guān)。這樣,我們就不僅知道兩個(gè)節(jié)點(diǎn)有關(guān)聯(lián),還可以定量和定性的描述這種關(guān)聯(lián)。
2.3 節(jié)點(diǎn)屬性
在實(shí)際應(yīng)用中,不同的節(jié)點(diǎn)具有不同的屬性。比如用于描述miRNA-mRNA調(diào)節(jié)關(guān)系的網(wǎng)絡(luò)中,每一個(gè)節(jié)點(diǎn)將會(huì)屬于miRNA或者mRNA,那么我們就可以再添加一列信息用于描述這種屬性。在本文中,我們假設(shè)A1-A11和B表示各不相同的12個(gè)基因,它們對(duì)于某一特定疾病具有不同的影響,如果增加患病風(fēng)險(xiǎn),我們使用一個(gè)正值表示,數(shù)值越大,則表示增加的風(fēng)險(xiǎn)越多(risk factor),反之亦然。在表中,E列和G列分別定量地表示Gene1(A1-A11)與Gene2(B)對(duì)疾病的影響強(qiáng)度和方向。F和H則定性的表示這種方向。
3. 參數(shù)調(diào)整
3.1 輸入準(zhǔn)備好的表格
給不同的列定義作用類別
Gene1列定義為source node,表示作為一個(gè)出發(fā)點(diǎn)
Gene2列定義為target node,表示作為一個(gè)目標(biāo)終點(diǎn)
cystoscape中的連接使用edge描述,因此edge attribute表示連接屬性。說明這一列的數(shù)據(jù)都是用來描述前面兩個(gè)對(duì)應(yīng)的節(jié)點(diǎn)的連接屬性的,即包含了連接屬性的定量或定性信息。
source node attribute表示出發(fā)點(diǎn)屬性。說明這一列的數(shù)據(jù)都是用來描述source node列的節(jié)點(diǎn)的節(jié)點(diǎn)屬性,即包含了節(jié)點(diǎn)本身性質(zhì)的一些信息,比如對(duì)疾病影響強(qiáng)度與方向。
target node attribute表示目標(biāo)節(jié)點(diǎn)點(diǎn)屬性。說明這一列的數(shù)據(jù)都是用來描述target node列的節(jié)點(diǎn)的節(jié)點(diǎn)屬性,即包含了節(jié)點(diǎn)本身性質(zhì)的一些信息,比如對(duì)疾病影響強(qiáng)度與方向。
之后就得到了最原始的一張網(wǎng)絡(luò)圖
3.2 在網(wǎng)絡(luò)圖中添加輸入的參數(shù)信息
可以非常明顯的看到這種圖除了比較丑之外,還丟失了很多信息。事實(shí)上,它支包含了節(jié)點(diǎn)之間的對(duì)應(yīng)信息,而節(jié)點(diǎn)屬性和連接屬性均沒有體現(xiàn)在圖上。下面來演示一下如何添加對(duì)應(yīng)的信息。
在左側(cè)style列選擇一個(gè)預(yù)設(shè)的風(fēng)格
在左下角選擇node,上方的界面就會(huì)顯示node節(jié)點(diǎn)的參數(shù)列表
下面調(diào)整節(jié)點(diǎn)的顏色,將對(duì)疾病有正向影響的節(jié)點(diǎn)表示為紅色,負(fù)影響的節(jié)點(diǎn)表示為藍(lán)色,B節(jié)點(diǎn)表示為綠色
完成之后
在左下角選擇edge 如圖所示,點(diǎn)擊對(duì)應(yīng)參數(shù)欄右下角的垃圾桶標(biāo)記將連接線上的文字去掉
在最下面的width欄調(diào)節(jié)線的寬度,在這里我們用寬度表示互作用強(qiáng)度,設(shè)置如下
但是連接線太寬了,可以通過雙擊左下角的圖表設(shè)置
這樣線條的寬度就比較合適了
下面我們來調(diào)節(jié)線條的顏色,用橙色表示正相關(guān),紫色表示負(fù)相關(guān)。這里我們用到了定性的參數(shù),分貝對(duì)1和-1的連接線定義顏色,就可以快速的進(jìn)行調(diào)整。
現(xiàn)在節(jié)點(diǎn)的對(duì)疾病的影響強(qiáng)度還沒有顯示,我們可以通過和調(diào)節(jié)線條寬度類似的操作來實(shí)現(xiàn),先將進(jìn)入node的參數(shù)列表
再調(diào)整一下字體大小,一張好看的網(wǎng)絡(luò)圖就完成了
Cystoscape是一款功能非常強(qiáng)大的軟件,這里僅展示了一小部分功能。應(yīng)結(jié)合 數(shù)據(jù)類型-參數(shù)設(shè)置方法-顯示結(jié)果 的對(duì)應(yīng)關(guān)系,靈活使用!
附:
Gene1Gene2COX_interactionCOX_interaction_directioneffect_Gene1effect_direction_Gene1effect_Gene2effect_direction_Gene2
A1B0.49998834513.25833384510.0112023221
A2B-0.516532244-1-3.878273038-10.0112023221
A3B0.41524582412.01047664610.0112023221
A4B0.44035785811.86937052610.0112023221
A5B0.41242079311.63010053810.0112023221
A6B-0.407099469-1-2.244444104-10.0112023221
A7B-0.451728351-1-1.227808813-10.0112023221
A8B0.45172878311.22779585410.0112023221
A9B0.42060242911.26914773310.0112023221
A10B-0.406904176-1-1.572218584-10.0112023221
A11B-0.42212353-1-1.96877414-10.0112023221
GEO芯片數(shù)據(jù)差異表達(dá)分析時(shí)需要log2處理的原因
https://blog.csdn.net/tuanzide5233/article/details/88542805GEO芯片數(shù)據(jù)差異表達(dá)分析時(shí)是否需要log2以及標(biāo)準(zhǔn)化的問題
https://blog.csdn.net/tuanzide5233/article/details/88542558差異表達(dá)矩陣制作教程
https://blog.csdn.net/tuanzide5233/article/details/83659768差異表達(dá)的熱圖繪制詳見
https://blog.csdn.net/tuanzide5233/article/details/83659501使用edgeR對(duì)RNAseq數(shù)據(jù)進(jìn)行差異表達(dá)分析教程
https://blog.csdn.net/tuanzide5233/article/details/88785486差異表達(dá)分析(DEG)時(shí) row.names'里不能有重復(fù)的名字 的解決方案
https://blog.csdn.net/tuanzide5233/article/details/86568155生存分析系列教程(一)使用生信人工具盒進(jìn)行生存分析
https://blog.csdn.net/tuanzide5233/article/details/83685403富集分析與蛋白質(zhì)互作用網(wǎng)絡(luò)(PPI)的可視化 Cystocape入門指南
https://blog.csdn.net/tuanzide5233/article/details/88048439進(jìn)階版Venn plot:Upset plot入門實(shí)戰(zhàn)代碼詳解——UpSetR包介紹
https://blog.csdn.net/tuanzide5233/article/details/83109527使用R語言ggplot2包繪制pathway富集分析氣泡圖(Bubble圖):數(shù)據(jù)結(jié)構(gòu)及代碼
https://blog.csdn.net/tuanzide5233/article/details/82141817