CNV,即拷貝數(shù)變異(copy number variation),一般指長度為1kb到幾個Mb基因組大片段的拷貝數(shù)復(fù)制、缺失。CNV在基因組中的存在形式主要有以下幾種:兩條同源染色體拷貝數(shù)同時出現(xiàn)缺失;1條同源染色體發(fā)生缺失,1條正常;一條同源染色體出現(xiàn)拷貝數(shù)重復(fù),另一條正常;1條同源染色體出現(xiàn)缺失,另一條出現(xiàn)拷貝數(shù)重復(fù);兩條同源染色體同時出現(xiàn)拷貝數(shù)重復(fù)。
CNV在人類基因組中分布廣泛,是人類疾病的重要致病因素之一。致病性CNV可引起智力障礙、生長發(fā)育遲緩、自閉癥、各種各樣的出生缺陷、白血病和腫瘤等多種疾病。目前對CNV進(jìn)行檢測的方法主要有aCGH, SNP-array, CNV-seq、MLPA等,這些方法各有哪些優(yōu)缺點(diǎn),我們又該如何選擇?
檢測方法一:aCGH
aCGH也稱為基于芯片的比較基因組雜交(array-based comparative genomic hybridization)。
原理:將等量的待測DNA和正常對照DNA分別用紅色和綠色熒光染料標(biāo)記,混合,然后與全基因組DNA芯片進(jìn)行競爭性雜交。雜交后的芯片經(jīng)激光掃描,比較每個點(diǎn)紅光和綠光的發(fā)光強(qiáng)度。若紅光過強(qiáng),表明待測樣本拷貝數(shù)復(fù)制;若紅光較弱,表明待測樣本拷貝數(shù)缺失;若紅綠光均等,則表明待測樣品拷貝數(shù)正常。
應(yīng)用:可以檢測全基因組水平上的CNV。
點(diǎn)評:aCGH的分辨率,取決于芯片中探針在全基因組中的密度和探針長度。安捷倫SurePrint G3 Human CGH Microarray 1×1M芯片中,探針間距約為2kb。因為來自一個點(diǎn)的熒光的光強(qiáng)變化,可能會帶有一定的偶然性,所以,一般是看染色體空間位置上相鄰的3個點(diǎn)(或者更多的點(diǎn)),如果這3個點(diǎn)的熒光比值,都發(fā)生同一個方向的偏離,就可以判斷這一段有拷貝數(shù)變異的證據(jù)?;谶@點(diǎn)考慮,按照3個點(diǎn)計算,aCGH的分辨率約為6kb。
檢測方法二:SNP-array
SNP(Single Nucleotide Polymorphisms,單核苷酸多態(tài))是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性而形成的遺傳標(biāo)記。SNP在人類基因組中廣泛存在,平均約每500-1000個堿基對中就有1個SNP,人類30億堿基中大約有300萬個。
原理: 與aCGH采用的雙雜交策略不同的是,SNP-array利用待測樣本與芯片探針進(jìn)行單雜交,通過比較不同樣本信號的強(qiáng)度來確定每個位點(diǎn)的拷貝數(shù)。
應(yīng)用:SNP-array芯片的探針為SNP位點(diǎn)序列,可以提供SNP信息。除可檢測CNV外,還可檢測單親二倍體(UPD)、雜合性缺失(LOH)和嵌合體。
點(diǎn)評:SNP 芯片探針在全基因組上的的密度非常大,分辨率很高。但是這些探針在基因組中并非均衡分布,在一些重復(fù)序列和復(fù)雜的CNV 區(qū)域, SNP 密度是較小的,不能得到較為清晰的CNV 圖譜。Affymetrix 公司和Illumina 公司在新一代芯片中增加一個非多態(tài)性的探針,將探針更好地定位在特定區(qū)域,提高圖譜的清晰度。目前Affymetrix 公司的CytoScan HD芯片為探針密度最高的芯片,含有270萬個探針,基因間探針間距平均為1kb。按照3個點(diǎn)計算,SNP-array的分辨率約為3kb。
單倍體基因組中等位基因核內(nèi)復(fù)制事件的檢測
圖中分別顯示:四倍體、三倍體、二倍體、單倍體
檢測方法三:CNV-seq
CNV-seq,即通過低倍全基因組測序檢測CNV的技術(shù),2009年由Xie[1]等開發(fā)提出。
原理:CNV-seq檢測原理與aCGH相似。將等量的待測樣本DNA和正常對照DNA建庫測序后,分別與reference sequence進(jìn)行對比。通過比較兩個樣本每個滑窗內(nèi)比對reads數(shù)目的多少來確定每個位點(diǎn)的拷貝數(shù)。
應(yīng)用:可以檢測全基因組水平上的大片段CNV。
點(diǎn)評:貝瑞和康采用雙盲實驗設(shè)計,對染色體結(jié)構(gòu)異常的樣本進(jìn)行檢測,滑窗大小為20kb的情況下,CNV-seq和高密度SNP-array對于已知致病CNVs都能達(dá)到100%的檢出[2]。與中等密度SNP-array相比,CNV-seq表現(xiàn)更優(yōu)。鑒于CNV-seq價格較低,CNV-seq可以替代微陣列芯片用于大片段CNV檢測。關(guān)于CNV-seq的分辨率取決于滑窗的大小。一般來講,如果是低倍基因組測序,要使滑窗內(nèi)的reads數(shù)目可信的話,所取的滑窗不可能太小。根據(jù)文章2描述,以20kb滑窗大小計算,按照3個點(diǎn)計算,CNV-seq的分辨率約為60kb。
aCGH和CNV-seq檢測CNV過程比較
檢測方法四:MLPA
MLPA(multiplex ligation-dependent probe amplication,多重連接依賴式探針擴(kuò)增)于2002年由荷蘭學(xué)者Dr.SchoutenJP等首先提出,是針對待檢DNA靶序列進(jìn)行定性和半定量分析的技術(shù)。
原理:在DNA靶序列的特定變異位點(diǎn)(如點(diǎn)突變)兩側(cè)設(shè)計一對MLPA探針。每條探針包含一段通用引物序列和一段特異性雜交序列。雜交序列與靶序列雜交后,使用連接酶將兩部分探針連接成一條核苷酸單鏈,再使用通用引物進(jìn)行PCR擴(kuò)增。通過比較待測DNA與正常對照DNA的PCR產(chǎn)物量,來確定待測樣本DNA靶序列的拷貝數(shù)。值得注意的是,連接酶很挑剔,只有在檢測位點(diǎn)處探針與靶序列完美互補(bǔ)配對的情況下,連接酶才能將兩部分探針順利連接成單鏈進(jìn)行后續(xù)擴(kuò)增。如果檢測位點(diǎn)存在甲基化、點(diǎn)突變、CNV,則探針連接失敗,不能進(jìn)行后續(xù)PCR擴(kuò)增。
應(yīng)用:驗證高度懷疑的特定基因中的點(diǎn)突變、甲基化、CNV。
點(diǎn)評:該技術(shù)具有快速及特異性高的特點(diǎn),但是不能對染色體組進(jìn)行全局分析。單一反應(yīng)管內(nèi)可以同時檢測40個不同的核苷酸序列的拷貝數(shù)變化。
總結(jié)
參考文獻(xiàn):
[1].Xie C, Tammi M. CNV-seq,a new method to detect copy number variation using high-throughput sequencing. BMC Bioinformatics, 2009, 10: 80
[2].Zhu X, Li J, Ru T, et al. Identification of copy number variations associated with congenital heart disease by chromosomal microarray analysis and next generation sequencing.[J]. Prenatal Diagnosis,2016, 36(4):321–327.