免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
菜鳥(niǎo)第一步,跪在數(shù)據(jù)處:R語(yǔ)言讀取數(shù)據(jù)

1. 溫故知坑

實(shí)踐是學(xué)習(xí)知識(shí)的最好途徑。之前我講的內(nèi)容都非常非常基礎(chǔ),包括:

(1)什么是R語(yǔ)言?R語(yǔ)言和Rstudio軟件的安裝,Rstudio的界面介紹;
(2)R語(yǔ)言的基本邏輯,基本數(shù)據(jù)類(lèi)型;
(3)ggplot基礎(chǔ)繪圖;
(4)學(xué)習(xí)R語(yǔ)言的思路(整理,總結(jié)問(wèn)題)。

通過(guò)不斷的踩坑,走彎路,我們可以在勤奮的基礎(chǔ)上,找一些快速的方法。我們已經(jīng)不能再像上大學(xué)時(shí)候一樣了,先啃完一本書(shū),學(xué)好各種基礎(chǔ)知識(shí),然后開(kāi)始應(yīng)用。工作之繁忙,生活之瑣碎,各種被電子產(chǎn)品占據(jù)走的時(shí)間。已經(jīng)很難找出一整塊的時(shí)間去學(xué)習(xí)了。

換句話說(shuō),沒(méi)有目的性的理論學(xué)習(xí)就是耍流氓。怎么講這么多數(shù)據(jù)類(lèi)型,格式,可是我用不著呀?因此,我們調(diào)整策略,按照完成project為主線來(lái)解說(shuō)在完成數(shù)據(jù)分析的過(guò)程中,我們需要用的R語(yǔ)言知識(shí)。

2. 一個(gè)超級(jí)簡(jiǎn)單的project流程

以我之前處理的GEO數(shù)據(jù)為藍(lán)本,我們?cè)敿?xì)的介紹每一個(gè)數(shù)據(jù)處理過(guò)程,所需要的知識(shí)(不僅僅是R語(yǔ)言代碼,還有各種背景知識(shí))。

步驟基本上是:導(dǎo)入數(shù)據(jù)--整理為可以進(jìn)行分析的形式--差異分析(火山圖等)--GO/KEGG注釋?zhuān)ǜ鞣N好看的圖)。其中每一個(gè)步驟都可以說(shuō)是好幾把辛酸淚。

但素!為了降低炸毛的風(fēng)險(xiǎn),我自己捏造了一段非常非常小的數(shù)據(jù)用來(lái)做示例。想要跟著我步驟的小伙伴,需要這小小數(shù)據(jù),你們可以想辦法找到我。

so,今天我們來(lái)講,導(dǎo)入數(shù)據(jù)!

(1)首先自然是要有數(shù)據(jù)

數(shù)據(jù)的來(lái)源:A. 自己課題組的各種測(cè)序結(jié)果,在經(jīng)過(guò)linux的上游分析之后,得到一個(gè)表達(dá)量和分組的表格(我們也稱之為表達(dá)矩陣),經(jīng)過(guò)精心整理之后,它大概需要變成這樣:

B. 從公共數(shù)據(jù)庫(kù)下載:例如GEO、TCGA數(shù)據(jù)庫(kù)(知識(shí)點(diǎn):自行去了解這兩個(gè)數(shù)據(jù)庫(kù)),那根據(jù)數(shù)據(jù)庫(kù)的不同,下載的數(shù)據(jù)也是有所不同的。GEO數(shù)據(jù)可以直接通過(guò)R語(yǔ)言下載,可以說(shuō)是非常方便了!

(2)載入數(shù)據(jù)方式

R語(yǔ)言載入數(shù)據(jù)的方式如下:

R語(yǔ)言數(shù)據(jù)的輸入:
(1)手打;(2)文本文件txt;(3)Excel;(4)Acess;(5)其他統(tǒng)計(jì)軟件出來(lái)的數(shù)據(jù),例如SPSS,SAS;(6)XML數(shù)據(jù);(7)網(wǎng)頁(yè)抓?。唬?)Stata;(9)netCDF;(10)HDF5;(11)通過(guò)數(shù)據(jù)庫(kù)接口下載;(12)通過(guò)Stat/Transfer導(dǎo)入數(shù)據(jù) 。

看到這么多會(huì)直接炸毛,這么多!沒(méi)關(guān)系,我們又沒(méi)有期末考,掌握自己所需要的就可以了。

最最最常見(jiàn)的數(shù)據(jù)就是txt,xls,csv(有點(diǎn)像xls)。

(3)讀取Excel文件

step 1-2  新建proj,管理文件,雙擊打開(kāi)

我在桌面上新建一個(gè)文件夾,叫做“train”。


step 3 將Excel另存為csv文件,而后載入
## 方法一:另存為csv文件之后,以下代碼均可以讀取數(shù)據(jù)
data_1<>'train.csv',header = T,sep = ',')
data_2<>'train.csv',header = T,sep = ',')

## 知識(shí)點(diǎn),header= T,sep=',' 是什么意思?
## header= T,字面上的意思就是:有抬頭,本文件的抬頭(即列名)就是:
> colnames(data_1)
[1'ensembl_id' 'control_1' 'control_2' 'control_3' 'experiment_1' 'experiment_2'
[7'experiment_3'

## 那什么是sep=',' 你試試看不要這么參數(shù)?試試嘛!
step 4 我偏不另存為,我就要讀Excel

好的,妥妥的滿足你!雖然我不會(huì),但是我去話了小潔大佬,她支的招就是,使用R包  tidyverse

詳情請(qǐng)看:如何實(shí)現(xiàn)Excel和R語(yǔ)言雙劍合璧

# 方法二:我偏不另存為,那就試試tidyverse包
install.packages('tidyverse')
library(tidyverse)  

# 調(diào)出幫助文檔,學(xué)習(xí)如何使用該包
?tidyverse

不想看幫助文檔學(xué)代碼的我,發(fā)現(xiàn)了一個(gè)小妙招:


## 根據(jù)R語(yǔ)言的提示,然后就妥妥的學(xué)會(huì)啦

data_3<>'train.xlsx')

最終三種方式載入的數(shù)據(jù)都是一樣的漂亮~


至于txt文檔怎么載入,我想你用到的時(shí)候,定會(huì)查到的!

3. 還是溫故知新的!

其實(shí)寫(xiě)這篇推文呢,我才是最大的收獲者,為了寫(xiě)得簡(jiǎn)潔明了,我回去自己看了一下書(shū),然后又請(qǐng)教了小潔,真是妥妥的--溫故知不足,求索方知新。大家加油吧!

再說(shuō)一遍~需要數(shù)據(jù)的同學(xué)要么找到我,要么你自己手打咯~~反正也不多嘛~


本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
初學(xué)者使用R語(yǔ)言讀取、寫(xiě)出文件(csv/txt/excel/rdata等)的注意事項(xiàng)
數(shù)據(jù)庫(kù)并行讀取和寫(xiě)入
如何進(jìn)行GEO臨床數(shù)據(jù)查詢
R語(yǔ)言 | 讀寫(xiě)txt、csv、excel文件
不了解生信?沒(méi)關(guān)系,手把手教你從GEO數(shù)據(jù)庫(kù)里挖掘一個(gè)課題!
手把手教你GEO數(shù)據(jù)庫(kù)表達(dá)譜差異基因分析(下):GEO2R
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服