實(shí)踐是學(xué)習(xí)知識(shí)的最好途徑。之前我講的內(nèi)容都非常非常基礎(chǔ),包括:
(1)什么是R語(yǔ)言?R語(yǔ)言和Rstudio軟件的安裝,Rstudio的界面介紹;
(2)R語(yǔ)言的基本邏輯,基本數(shù)據(jù)類(lèi)型;
(3)ggplot基礎(chǔ)繪圖;
(4)學(xué)習(xí)R語(yǔ)言的思路(整理,總結(jié)問(wèn)題)。
通過(guò)不斷的踩坑,走彎路,我們可以在勤奮的基礎(chǔ)上,找一些快速的方法。我們已經(jīng)不能再像上大學(xué)時(shí)候一樣了,先啃完一本書(shū),學(xué)好各種基礎(chǔ)知識(shí),然后開(kāi)始應(yīng)用。工作之繁忙,生活之瑣碎,各種被電子產(chǎn)品占據(jù)走的時(shí)間。已經(jīng)很難找出一整塊的時(shí)間去學(xué)習(xí)了。
換句話說(shuō),沒(méi)有目的性的理論學(xué)習(xí)就是耍流氓。怎么講這么多數(shù)據(jù)類(lèi)型,格式,可是我用不著呀?因此,我們調(diào)整策略,按照完成project為主線來(lái)解說(shuō)在完成數(shù)據(jù)分析的過(guò)程中,我們需要用的R語(yǔ)言知識(shí)。
以我之前處理的GEO數(shù)據(jù)為藍(lán)本,我們?cè)敿?xì)的介紹每一個(gè)數(shù)據(jù)處理過(guò)程,所需要的知識(shí)(不僅僅是R語(yǔ)言代碼,還有各種背景知識(shí))。
但素!為了降低炸毛的風(fēng)險(xiǎn),我自己捏造了一段非常非常小的數(shù)據(jù)用來(lái)做示例。想要跟著我步驟的小伙伴,需要這小小數(shù)據(jù),你們可以想辦法找到我。
數(shù)據(jù)的來(lái)源:A. 自己課題組的各種測(cè)序結(jié)果,在經(jīng)過(guò)linux的上游分析之后,得到一個(gè)表達(dá)量和分組的表格(我們也稱之為表達(dá)矩陣),經(jīng)過(guò)精心整理之后,它大概需要變成這樣:
B. 從公共數(shù)據(jù)庫(kù)下載:例如GEO、TCGA數(shù)據(jù)庫(kù)(知識(shí)點(diǎn):自行去了解這兩個(gè)數(shù)據(jù)庫(kù)),那根據(jù)數(shù)據(jù)庫(kù)的不同,下載的數(shù)據(jù)也是有所不同的。GEO數(shù)據(jù)可以直接通過(guò)R語(yǔ)言下載,可以說(shuō)是非常方便了!
R語(yǔ)言載入數(shù)據(jù)的方式如下:
R語(yǔ)言數(shù)據(jù)的輸入:
(1)手打;(2)文本文件txt;(3)Excel;(4)Acess;(5)其他統(tǒng)計(jì)軟件出來(lái)的數(shù)據(jù),例如SPSS,SAS;(6)XML數(shù)據(jù);(7)網(wǎng)頁(yè)抓?。唬?)Stata;(9)netCDF;(10)HDF5;(11)通過(guò)數(shù)據(jù)庫(kù)接口下載;(12)通過(guò)Stat/Transfer導(dǎo)入數(shù)據(jù) 。
看到這么多會(huì)直接炸毛,這么多!沒(méi)關(guān)系,我們又沒(méi)有期末考,掌握自己所需要的就可以了。
最最最常見(jiàn)的數(shù)據(jù)就是txt,xls,csv(有點(diǎn)像xls)。
我在桌面上新建一個(gè)文件夾,叫做“train”。
## 方法一:另存為csv文件之后,以下代碼均可以讀取數(shù)據(jù)
data_1<>'train.csv',header = T,sep = ',')
data_2<>'train.csv',header = T,sep = ',')
## 知識(shí)點(diǎn),header= T,sep=',' 是什么意思?
## header= T,字面上的意思就是:有抬頭,本文件的抬頭(即列名)就是:
> colnames(data_1)
[1] 'ensembl_id' 'control_1' 'control_2' 'control_3' 'experiment_1' 'experiment_2'
[7] 'experiment_3'
## 那什么是sep=',' 你試試看不要這么參數(shù)?試試嘛!
好的,妥妥的滿足你!雖然我不會(huì),但是我去話了小潔大佬,她支的招就是,使用R包 tidyverse
詳情請(qǐng)看:如何實(shí)現(xiàn)Excel和R語(yǔ)言雙劍合璧
# 方法二:我偏不另存為,那就試試tidyverse包
install.packages('tidyverse')
library(tidyverse)
# 調(diào)出幫助文檔,學(xué)習(xí)如何使用該包
?tidyverse
不想看幫助文檔學(xué)代碼的我,發(fā)現(xiàn)了一個(gè)小妙招:
## 根據(jù)R語(yǔ)言的提示,然后就妥妥的學(xué)會(huì)啦
data_3<>'train.xlsx')
其實(shí)寫(xiě)這篇推文呢,我才是最大的收獲者,為了寫(xiě)得簡(jiǎn)潔明了,我回去自己看了一下書(shū),然后又請(qǐng)教了小潔,真是妥妥的--溫故知不足,求索方知新。大家加油吧!
再說(shuō)一遍~需要數(shù)據(jù)的同學(xué)要么找到我,要么你自己手打咯~~反正也不多嘛~
聯(lián)系客服