999这里只有精品,国产精品久久久久精品三级涩

基因型數(shù)據(jù)012及-1,0,1計算基因頻率

育種數(shù)據(jù)分析 >《待分類》

2021.11.18

關(guān)注

G矩陣計算時, 有不同的編碼形式, 我們看一下計算的區(qū)別.

第一種方法按照012, 即AA是0, 表示major基因, 1 表示雜合, 2表示aa(minor).

第二種方法按照-1, 0, 1, 即-1是AA, 表示major基因型, 0表示雜合, 1表示aa(minor).

下面我們模擬一下數(shù)據(jù), 看一下兩者計算的區(qū)別.

數(shù)據(jù)

dat = data.frame(snpid = paste0("snp",1:7),type = c("GG","GG","AG","GG","AG","GG","AA"))dat

snpid	type
snp1	GG
snp2	GG
snp3	AG
snp4	GG
snp5	AG
snp6	GG
snp7	AA

上面是7個SNP的基因型, 可以看出GG是major, AA為minor.

1, 手動計算

GG個數(shù): 4
AG個數(shù): 2
AA個數(shù): 1

計算方法, 所有G的個數(shù), 除以總配子的個數(shù), 即為G的基因頻率

p_g = (4*2+2*1)/(7*2);p_g

0.714285714285714

p_a = (2*1+1*2)/(7*2);p_a

0.285714285714286

2, 轉(zhuǎn)化為012

如何計算基因頻率(major為0, minor為2)

dat$type012 = 0
dat[dat$type=="GG",]$type012 =0
dat[dat$type %in% c("AG","GA"),]$type012 =1
dat[dat$type=="AA",]$type012 =2

dat

snpid	type	type012
snp1	GG	0
snp2	GG	0
snp3	AG	1
snp4	GG	0
snp5	AG	1
snp6	GG	0
snp7	AA	2

計算方法:

將type012所有列之和相加, 為minor的基因個數(shù), 除以2*n, 即為minor的基因頻率

sum(dat$type012)/(length(dat$type012)*2)

0.285714285714286

3, 轉(zhuǎn)化為-1,0,1

計算方法(-1為major, 0為雜合,1為minor)

dat$type_101 = dat$type012 -1dat

snpid	type	type012	type_101
snp1	GG	0	-1
snp2	GG	0	-1
snp3	AG	1	0
snp4	GG	0	-1
snp5	AG	1	0
snp6	GG	0	-1
snp7	AA	2	1

計算方法:

分子為: 列之和 + 行數(shù)

分母為: 行數(shù) * 2

(sum(dat$type_101) + length(dat$type_101))/(2*length(dat$type_101))

0.285714285714286

結(jié)論:

1, 如果轉(zhuǎn)化為0, 1, 2, 那么他們之和即為minor的個數(shù), 除以2n即為minor的頻率. 因為major的值為0, 1為雜合, 同時表示有一個minor, 2為純合, 表示2個minor, 計算比較方便.

2, 如果基因型轉(zhuǎn)化為-1, 0, 1的話, 那么將其進(jìn)行求和, -1和1抵消. 推斷過程如下:

假設(shè)A的頻率為(1-q), a的頻率為q, n為個數(shù).

AA的個數(shù)為x

Aa的個數(shù)為y

aa的個數(shù)為z

x + y + z =n

q = (2*z + y)/(2*n)

-1*x +0*y + 1*z = z-x

2*z +y = 2*z + (n - x -z) = n + z - x #分子

因此:

q = (n + z -x)/(2*n)

這種方法, 計算量比較小, 因為-1 和1 進(jìn)行了抵消.

這種方法不太直觀, 需要用筆畫一下即可理解.

所以, 我們計算G矩陣時, 將SNP分型轉(zhuǎn)化為-1, 0, 1的形式.

如何利用系譜計算近交系數(shù)和親緣關(guān)系系數(shù)

如何構(gòu)建G矩陣-基因組親緣關(guān)系矩陣（Genomic relationships matrix）

育種中一般配合力和特殊配合力的計算方法

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點(diǎn)擊舉報。

打開APP，閱讀全文并永久保存查看更多類似文章

20秒看出對方是不是個好人

ASCO2014：ERP29基因多態(tài)性影響乳腺癌易感性及預(yù)后

文獻(xiàn)&工具 | 整合GWAS和QTL預(yù)測復(fù)雜性狀的靶基因 | SMR

stacks基礎(chǔ)：SNP、基因座、等位基因、基因型、單倍型的概念

群體遺傳學(xué)知識點(diǎn)歸納

CYP2C19基因多態(tài)性與冠心病危險因素對氯吡格雷反應(yīng)多樣性的影響

更多類似文章 >>

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

G矩陣計算時, 有不同的編碼形式, 我們看一下計算的區(qū)別.

第一種方法按照012, 即AA是0, 表示major基因, 1 表示雜合, 2表示aa(minor).

數(shù)據(jù)

上面是7個SNP的基因型, 可以看出GG是major, AA為minor.

1, 手動計算

2, 轉(zhuǎn)化為012

如何計算基因頻率(major為0, minor為2)

3, 轉(zhuǎn)化為-1,0,1

計算方法(-1為major, 0為雜合,1為minor)