上一期的RNA-seq結(jié)果怎么才能看懂?答案全在這些圖里---(1)測(cè)序質(zhì)量篇,(點(diǎn)這里查看這一期微信),我們介紹了評(píng)估RNA測(cè)序質(zhì)量的一些常見圖示。本期,小編繼續(xù)“看圖說話”,一起看看RNA-seq基礎(chǔ)分析里的圖示都反映了哪些內(nèi)容吧。
1
主成分分析圖(PCA圖)----用RNA測(cè)序結(jié)果體現(xiàn)樣本聚類
主成分分析圖是生信分析中最樸實(shí)無華的,因?yàn)檎l都能看的懂。我們不需要操心X,Y軸的主成分到底是什么,只要明白每個(gè)樣本都被一個(gè)2維坐標(biāo)(X,Y)定位到了這張圖上。對(duì)于基于轉(zhuǎn)錄組的PCA圖中,如果兩個(gè)樣本距離越遠(yuǎn),則說明兩個(gè)樣本轉(zhuǎn)錄組差異越大。我們最想看到的情況就是,相同表型的個(gè)體(比如疾病組)會(huì)在圖中聚類在一起。
2
差異基因表達(dá)散點(diǎn)圖----體現(xiàn)重復(fù)樣本的重復(fù)性好不好
我們可以簡單的把這張圖理解為2個(gè)樣本的RNAseq結(jié)果關(guān)聯(lián)度散點(diǎn)圖。X,Y軸分別是兩個(gè)樣本,每個(gè)點(diǎn)代表一個(gè)基因在兩個(gè)樣品中 FPKM 的對(duì)數(shù)值(FPKM是RNAseq中衡量基因表達(dá)高低的常用數(shù)值)。從這張圖可以觀察,偏離對(duì)角線的點(diǎn)越多,說明樣品表達(dá)量的相關(guān)性越低,重復(fù)性越差;偏離對(duì)角線的點(diǎn)越少,則說明樣品間表達(dá)量的相關(guān)性越高,重復(fù)樣品的重復(fù)性越好。
3
差異基因表達(dá)火山圖---直觀展示上調(diào)表達(dá)和下調(diào)表達(dá)基因數(shù)量
對(duì)于常規(guī)的2組樣本RNAseq研究,我們關(guān)心的是組1和組2到底哪些基因有顯著的差異表達(dá)(T檢驗(yàn)獲得P值,p值反映顯著性),差異表達(dá)基因在組1和組2之間到底差了多少倍。
這些信息都是通過火山圖展示了出來的?;鹕綀D是以log2(差異倍數(shù))為橫坐標(biāo),以T檢-log10(P值)為縱坐標(biāo)。所以,我們最關(guān)心的基因就是圖中左上角和右上角的點(diǎn),分別表示表達(dá)水平差異非常顯著的下調(diào)基因和上調(diào)基因。
4
差異基因聚類熱圖---體現(xiàn)樣本聚類和基因聚類
聚類熱圖體現(xiàn)了2個(gè)層次的聚類,一般會(huì)在橫軸和縱軸的位置展示。如下圖橫軸頂部的線圖,展示了樣本的聚類;而下圖左側(cè)線圖,可以將不同樣本中表達(dá)模式相同或相似的基因聚為一類,這樣的聚類有助于推測(cè)未知基因功能或已知基因是否具有新功能。
5
差異基因韋恩圖---用于尋找“交集”
韋恩圖也叫文氏圖,用于顯示元素集合重疊區(qū)域的圖示。對(duì)于RNAseq來說,至少有三個(gè)組別的樣本才能繪制韋恩圖。比如對(duì)于下圖來說,A與B對(duì)比,差異表達(dá)基因有353+492個(gè),B與C對(duì)比,差異表達(dá)基因有353+51個(gè),那么同時(shí)在這2種比較里面都是差異表達(dá)的基因數(shù)目即為353個(gè)。
6
時(shí)間/濃度序列基因表達(dá)變化趨勢(shì)圖—按趨勢(shì)聚類
對(duì)于探究不同時(shí)間點(diǎn),或者不同濃度處理下的樣本的表達(dá)量變化,通常需要如下的趨勢(shì)圖。該圖展示了依據(jù)不同時(shí)間點(diǎn)的表達(dá)量,這些基因可以被聚成多少cluster,同一cluster的基因可能具有相似或相關(guān)的基因功能。
以上便是RNA-seq數(shù)據(jù)基礎(chǔ)分析相關(guān)的圖示介紹。下一期預(yù)告:RNA-seq結(jié)果怎么才能看懂?答案全在這些圖里---(2)高大上個(gè)性化篇,將重點(diǎn)介紹RNA-seq結(jié)果不常見的個(gè)性化展示圖。敬請(qǐng)期待!
創(chuàng)新基因科技,成就科學(xué)夢(mèng)想
聯(lián)系客服