IGV 官網(wǎng)http://software.broadinstitute.org/software/igv/download~ Broadinstitute出品
Java version8 下載: https://www.java.com/en/download/mac_download.jsp
IGV內(nèi)置的物種基因組及基因組來(lái)源:http://software.broadinstitute.org/software/igv/Genomes
完整的官方幫助文檔:http://software.broadinstitute.org/software/igv/book/export/html/6
之前mac不小心升級(jí)了一下java,然后igv就不能用了,要寫(xiě)教程必須降級(jí)java
首先,看官方說(shuō)明,需要安裝Java -8,9以上版本不支持。我的mac不知道什么時(shí)候更新到了java 10,按說(shuō)可以向下兼容,但是事與愿違,igv不能正常使用了。
需要降級(jí)Java,mac用戶可以直接參考,windows可以試下直接下載安裝IGV:
先刪除原來(lái)的java
terminal
打開(kāi)終端,復(fù)制粘貼一下三條命令:sudo rm -fr /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin
sudo rm -fr /Library/PreferencesPanes/JavaControlPanel.prefPane
sudo rm -fr ~/Library/Application\ Support/Java
??:不要通過(guò)/usr/bin 刪除 Java 工具來(lái)卸載 Java。此目錄是系統(tǒng)軟件的一部分,下次對(duì)操作系統(tǒng)執(zhí)行更新時(shí),Apple 會(huì)重置所有更改。
finder
中進(jìn)入 /Library/Java/JavaVirtualMachines
,然后刪除之前的jdk.版本號(hào)
下載安裝新的Java version8
【Windows用戶下載,解壓后,點(diǎn)擊igv.bat文件即可啟動(dòng);如果啟動(dòng)失敗,用記事本打開(kāi)并編輯igv.bat文件,在文件的最后新起一行輸入pause,保存后,再嘗試打開(kāi),就可以在Windows下的命令行界面(cmd命令提示符)看到錯(cuò)誤信息,再根據(jù)信息提示去解決問(wèn)題;不過(guò)一般問(wèn)題不大】
好啦,問(wèn)題解決啦,開(kāi)始正式IGV介紹!
它是一款本地的探索基因組數(shù)據(jù)的可視化瀏覽器,有多個(gè)系統(tǒng)版本,支持多種不同類(lèi)型的輸入格式,包括芯片測(cè)序、二代測(cè)序、基因組注釋文件等。推薦使用BAM與SAM格式,主要格式見(jiàn)下表
數(shù)據(jù)來(lái)源 | 文件格式 |
---|---|
序列比對(duì) | SAM/BAM |
顯示覆蓋率 | TDF |
拷貝數(shù) | SNP、CN |
基因表達(dá) | GCT、RES |
基因注釋 | GFF3/GTF、BED |
突變數(shù)據(jù) | MUT |
追蹤參考基因組覆蓋度、測(cè)序深度(UCSC) | WIG、BW |
每次打開(kāi)會(huì)自動(dòng)加載hg19.fa文件,也就是人類(lèi)基因組,一會(huì)進(jìn)入主界面
這里我會(huì)舉一個(gè)昆蟲(chóng)中一種——棉鈴蟲(chóng),這個(gè)基因組是17年2月更新在NCBI傷的,屬于小眾物種,IGV并沒(méi)有收錄。正好拿來(lái)練手,當(dāng)然如果你研究的領(lǐng)域也有基因組被測(cè)出來(lái),也可以試一試【注意:在提交基因組文件到IGV之前,要先構(gòu)建索引】
這些工作都可以在本地進(jìn)行,只需要打開(kāi)你本地的git_bash或者putty/xshell或者terminal,解壓縮基因組文件=》下載samtools(推薦用conda管理)=>構(gòu)建索引samtools faidx genome.fasta
=>IGV中 輸入fasta文件路徑=》提供注釋文件(可以是組裝基因組預(yù)測(cè)的基因注釋文件,也可以是拼接轉(zhuǎn)錄組用的gtf文件)=〉其他選項(xiàng)可以忽略=》點(diǎn)擊OK推彈出一個(gè)框讓你輸入存儲(chǔ)路徑
這里以人類(lèi)基因組注釋文件為例,下載gtf到電腦
下載完不要急著導(dǎo)入,需要先構(gòu)建索引
然后會(huì)生成gff3.idx或者gtf.idx文件,說(shuō)明構(gòu)建了索引,接著導(dǎo)入File -> Load from file
,選擇sorted的注釋文件
我這里準(zhǔn)備的bam文件大小是2.8G,是由人類(lèi)轉(zhuǎn)錄組測(cè)序數(shù)據(jù)得到的,準(zhǔn)備的參考基因組是hg19
,注釋文件是gencode.v28lift37.annotation.sorted.gff3
bam文件在導(dǎo)入前,要先使用samtools進(jìn)行sort和index,samtools sort test.bam test.sort``samtools index test.sort.bam
,生成一個(gè)后綴為“.fai”的文件,它根據(jù)文件名自動(dòng)和.bam關(guān)聯(lián), 另外這兩個(gè)文件要在一個(gè)文件夾下,最后將bam導(dǎo)入IGV中
載入bam后,默認(rèn)會(huì)出現(xiàn)兩個(gè)track(翻譯的話,可以理解為不同的軌道,顯示不同的信息)Coverage track和Alignment track。
另外基因組信息也可以有collapsed、expanded、squished三種展示形式
查看Coverage track
它的意思是顯示比對(duì)文件的覆蓋率和測(cè)序深度。橫坐標(biāo)是基因組上的位置,縱坐標(biāo)是該位置的測(cè)序深度?!臼髽?biāo)放在每一個(gè)位點(diǎn)都會(huì)顯示一個(gè)小方框,其中的的內(nèi)容就是顯示總共有多少reads在這個(gè)位置,每個(gè)堿基各是什么】
點(diǎn)右上角+放大reads可視化窗口后,track會(huì)以灰色的條形圖來(lái)顯示每個(gè)位點(diǎn)的測(cè)序深度。如果某一個(gè)核苷酸與參考序列相比,有超過(guò)20%的reads是不同的,條形圖會(huì)顯示不同的顏色
關(guān)于上圖中的右鍵菜單,解釋如下
功能 | 含義 |
---|---|
Rename Track | 更改track名 |
Change Track Color | 更改背景色,比如把Coverage Track灰色變紫色 |
Change Track Height | 改變每一個(gè)track的高度 |
Change Font Size | 改變IGV最左側(cè)字體大小 |
Set Data Range | 覆蓋深度的范圍設(shè)置 |
Log scale | 用對(duì)數(shù)尺度作圖 |
AutoScale | 是否自動(dòng)縮放 |
這里看到有許多顏色,這些顏色是根據(jù)定義不同比對(duì)類(lèi)型而不同,
查找結(jié)構(gòu)變異
灰色:與參看基因組可以比對(duì)的reads
紫色I:插入(鼠標(biāo)查看插入的堿基信息)
黑色橫線:——缺失
歡迎關(guān)注我們的公眾號(hào)~_~
我們是兩個(gè)農(nóng)轉(zhuǎn)生信的小碩,打造生信星球,想讓它成為一個(gè)不拽術(shù)語(yǔ)、通俗易懂的生信知識(shí)平臺(tái)。需要幫助或提出意見(jiàn)請(qǐng)后臺(tái)留言或發(fā)送郵件到Bioplanet520@outlook.com
聯(lián)系客服