1 基因芯片概述
隨著人類基因組計劃( Human Genome Project)即全部核苷酸測序的即將完成,人類基因組研究的重心逐漸進入后基因組時代( Postgenome Era)向基因的功能及基因的多樣性傾斜。通過對個體在不同生長發(fā)育階段或不同生理狀態(tài)下大量基因表達的平行分析,研究相應基因在生物體內(nèi)的功能,闡明不同層次多基因協(xié)同作用的機理,進而在人類重大疾病如癌癥、心血管疾病的發(fā)病機理、診斷治療、藥物開發(fā)等方面的研究發(fā)揮巨大的作用。它將大大推動人類結(jié)構(gòu)基因組及功能基因組的各項基因組研究計劃。
基因芯片的工作原理與經(jīng)典的核酸分子雜交方法(southern 、northern)是一致的,都是應用已知核酸序列作為探針與互補的靶核苷酸序列雜交,通過隨后的信號檢測進行定性與定量分析,基因芯片在一微小的基片(硅片、玻片、塑料片等)表面集成了大量的分子識別探針,能夠在同一時間內(nèi)平行分析大量的基因,進行大信息量的篩選與檢測分析。基因芯片主要技術流程包括:芯片的設計與制備;靶基因的標記;芯片雜交與雜交信號檢測。
基因芯片的設計實際上是指芯片上核酸探針序列的選擇以及排布,設計方法取決于其應用目的,目前的應用范圍主要包括基因表達和轉(zhuǎn)錄圖譜分析及靶序列中單堿基多態(tài)位點(single nucleotide polymorphism,SNP)或突變點的檢測,表達型芯片的目的是在雜交實驗中對多個不同狀態(tài)樣品(不同組織或不同發(fā)育階段、不同藥物刺激)中數(shù)千基因的表達差異進行定量檢測,探針序列一般來自于已知基因的cDNA 或EST庫,設計時序列的特異性應放在首要位置,以保證與待測目的基因的特異結(jié)合,對于同一目的基因可設計多個序列不相重復的探針,使最終的數(shù)據(jù)更為可靠?;騿螇A基多態(tài)檢測的芯片一般采用等長移位設計法,即按靶序列從頭到尾依次取一定長度的互補的核苷酸序列形成一探針組合,這組探針是與靶序列完全匹配的野生型探針,然后對于每一野生型探針,將其中間位置的某一堿基分別用其它三種堿基替換,形成三種不同的單堿基變化的核苷酸探針,這種設計可以對某一段核酸序列所有可能的SNPs位點進行掃描。
芯片制備方法主要包括兩種類型:(1)點樣法:首先是探針庫的制備, 根據(jù)基因芯片的分析目標從相關的基因數(shù)據(jù)庫中選取特異的序列進行PCR擴增或直接人工合成寡核苷酸序列,然后通過計算機控制的三坐標工作平臺用特殊的針頭和微噴頭分別把不同的探針溶液逐點分配在玻璃、尼龍以及其它固相基片表面的不同位點上,通過物理和化學的方法使之固定,該方法各技術環(huán)節(jié)均較成熟,且靈活性大,適合于研究單位根據(jù)需要自行制備點陣規(guī)模適中的基因芯片。(2)原位合成法:該法是在玻璃等硬質(zhì)表面上直接合成寡核苷酸探針陣列,目前應用的主要有光去保護并行合成法,壓電打印合成法等,其關鍵是高空間分辨率的模板定位技術和高合成產(chǎn)率的DNA化學合成技術,適合制作大規(guī)模DNA探針芯片,實現(xiàn)高密度芯片的標準化和規(guī)?;a(chǎn)。
待分析樣品的制備是基因芯片實驗流程的一個重要環(huán)節(jié), 靶基因在與芯片探針結(jié)合雜交之前必需進行分離、擴增及標記。標記方法根據(jù)樣品來源、芯片類型和研究目的的不同而有所差異。通常是在待測樣品的PCR擴增、逆轉(zhuǎn)錄或體外轉(zhuǎn)錄過程中實現(xiàn)對靶基因的標記。對于檢測細胞內(nèi)mRNA表達水平的芯片,一般需要從細胞和組織中提取RNA,進行逆轉(zhuǎn)錄,并加入偶聯(lián)有標記物的dNTP,從而完成對靶基因的標記過程,對于陣列密度較小的芯片可以用同位素,所需儀器均為實驗室常規(guī)使用設備,易于開展相關工作,但是在信號檢測時,一些雜交信號強的點陣容易產(chǎn)生光暈,干擾周圍信號的分析。高密度芯片的分析一般采用熒光素標記靶基因,通過適當內(nèi)參的設置及對熒光信號強度的標化可對細胞內(nèi)mRNA的表達進行定量檢測。近年來運用的多色熒光標記技術可更直觀地比較不同來源樣品的基因表達差異,即把不同來源的靶基因用不同激發(fā)波長的熒光素標記,并使它們同時與基因芯片雜交,通過比較芯片上不同波長熒光的分布圖獲得不同樣品間差異表達基因的圖譜,常用的雙色熒光試劑有Cy3- dNTP和Cy5- dNTP。對多態(tài)性和突變檢測型基因芯片采用多色熒光技術可以大大提高芯片的準確性和檢測范圍,例如用不同的熒光素分別標記靶序列及單堿基失配的參考序列,使它們同時與芯片雜交,通過不同熒光強弱的比較得出靶序列中堿基失配的信息。
基因芯片與靶基因的雜交過程與一般的分子雜交過程基本相同,雜交反應的條件要根據(jù)探針的長度、GC堿基含量及片的類型來優(yōu)化,如用于基因表達檢測,雜交的嚴格性較低,而用于突變檢測的芯片的雜交溫度高,雜交時間短,條件相對嚴格。如果是用同位素標記靶基因,其后的信號檢測即是放射自顯影,若用熒光標記,則需要一套熒光掃描及分析系統(tǒng),對相應探針陣列上的熒光強度進行分析比較,從而得到待測樣品的相應信息。由于基因芯片獲取的信息量大,對于基因芯片雜交數(shù)據(jù)的分析、處理、查詢、比較等需要一個標準的數(shù)據(jù)格式,目前,一個大型的基因芯片的數(shù)據(jù)庫正在構(gòu)建中,將各實驗室獲得的基因芯片的結(jié)果集中起來,以利于數(shù)據(jù)的交流及結(jié)果的評估與分析。
2 基因芯片的應用
基因表達圖譜的繪制是目前基因芯片應用最廣泛的領域,也是人類基因組工程的重要組成部分,它提供了從整體上分析細胞表達狀況的信息,而且為了解與某些特殊生命現(xiàn)象相關的基因表達提供了有力的工具,對于基因調(diào)控以及基因相互作用機理的探討有重要作用。人類基因組編碼大約100000個不同的基因,因此,具有監(jiān)測大量mRNA的實驗工具很重要?;?strong>芯片技術可清楚地直接快速地檢測出以1∶300000水平出現(xiàn)的mRNA,且易于同時監(jiān)測成千上萬的基因。目前,已能夠在1.6cm2面積上合成和閱讀含400000個探針的陣列,可監(jiān)測10000個基因的表達狀況。斯坦福大學的Brown用制備的酵母cDNA芯片,獲得酵母在不同細胞周期狀態(tài)以及在熱休克冷休克處理后其2473個基因的表達圖譜,較直觀地反應了不同條件和狀態(tài)下基因轉(zhuǎn)錄調(diào)控水平,從而為尋找基因調(diào)控的機理提供了一條有效的途徑。
定量監(jiān)測大量基因表達水平在闡述基因功能、探索疾病原因及機理、發(fā)現(xiàn)可能的診斷及治療的靶基因等方面具有重要價值的。Derisi等選用來自惡性腫瘤細胞系UACC903中的1161個cDNA克隆制成芯片,通過比較正常和腫瘤細胞的表達差異,發(fā)現(xiàn)在惡性腫瘤細胞中P21基因處于失活或關閉狀態(tài),但在逆轉(zhuǎn)的細胞系中呈高表達。Golub等應用cDNA 芯片檢測基因表達的差異進行癌癥的分類,成功地區(qū)分出急性髓細胞性白血?。ˋML)和急性淋巴細胞性白血病(ALL),預期這種方法還能診斷出新的白血病種類。在炎癥性疾病類風濕性關節(jié)炎(RA)和炎癥性腸病(IBD)的基因表達研究中,可檢測出炎癥疾病誘導的基因如TNF-α、IL或粒細胞集落刺激因子,同時發(fā)現(xiàn)一些以前未發(fā)現(xiàn)的基因如HME基因和黑色素瘤生長刺激因子。目前,大量涌現(xiàn)的人類ESTs給cDNA微陣列提供了豐富的序列資源,數(shù)據(jù)庫中ESTs代表了人類基因,因此ESTs微陣列可在缺乏其它序列信息的條件下用于基因發(fā)現(xiàn)和基因表達檢測,從而加快人類基因組功能分析的進程。
基因芯片的另一重要應用是基因多態(tài)位點及基因突變的檢測,現(xiàn)有大量實例說明,基因組多樣性的研究對闡明不同人群和個體在疾病的易感性和抵抗性方面表現(xiàn)出的差異具有重要意義,一旦對基因組的編碼序列進行系統(tǒng)篩查,就有可能找出與疾病易感性有關的大量基因變異?;蛐酒夹g可大規(guī)模地檢測和分析DNA的變異及多態(tài)性。Wang等應用高密度基因芯片對2.3Mb人類基因的SNP 進行篩查,確定了3241個SNPs位點,顯示出大規(guī)模鑒定人類基因型的可能。Lipshutz等人采用含18,495個寡核苷酸探針的微陣列,對HIV-1基因組反轉(zhuǎn)錄酶基因(rt)及蛋白酶基因(pro)的高度多態(tài)性進行了篩選,這些變異將導致病毒對多種抗病毒藥物包括AZT、ddI、ddC等表現(xiàn)出抗性,因此rt與pro的變異與多態(tài)性的檢測具有重要的臨床意義。隨著大量疾病相關基因的發(fā)現(xiàn),變異與多態(tài)性分析將在疾病的診斷與治療方面體現(xiàn)出越來越重要的價值。Affymetrix公司已將P53 基因的全長序列和已知突變的序列制成探針集成在芯片上,可對與P53 基因突變相關的癌癥進行早期診斷。Hacia等采用含96600個20聚寡核苷酸高密度陣列對遺傳性乳腺和卵巢癌BRCA1基因3.45kb的第11個外顯子進行雜合變異篩選,結(jié)果準確診斷出15個已知變異的患者樣品中的14個,而在20個對照樣品中未發(fā)現(xiàn)1例假陽性,表明DNA芯片技術在某些疾病相關基因可能的雜合變異的檢測方面所具有的靈敏度與特異性是令人滿意的。
芯片技術中雜交測序技術(sequencing by hybridization,SBH)是一種新的高效快速測序方法,也是基因芯片的另一重要應用,其原理與芯片檢測多態(tài)位點相類似,即通過與一組已知序列的核酸探針雜交進行序列測定,用熒光標記的待測序列與基因芯片上對應位置的核酸探針產(chǎn)生互補配對時,通過確定熒光強度最強的探針位置,獲得一組序列互補的探針序列,據(jù)此可重組出靶核酸的序列。用含65536個8聚寡核苷酸的微陣列,采用SBH技術,可測定200bp長DNA序列采用67108864個13聚寡核苷酸的微陣列,可對數(shù)千個堿基長的DNA測序。
3 結(jié)束語
基因芯片技術的出現(xiàn)不過短短幾年時間,其發(fā)展勢頭十分迅猛,在生命科學的各個領域得到廣泛地應用,但其存在的缺陷也是相當明顯的。首先是成本的問題,由于芯片制作的工藝復雜,信號檢測也需專門的儀器設備,一般實驗室難以承擔其高昂的費用,其次在芯片實驗技術上還有多個環(huán)節(jié)尚待提高,如在探針合成方面,如何進一步提高合成效率及芯片的集成程度是研究的焦點。而樣品制備的簡單化與標準化則芯片應用進一步普及的前提。雖然芯片技術還存在這樣或那樣的問題,但其在基因表達譜分析、基因診斷、藥物篩選及序列分析等諸多領域已呈現(xiàn)出廣闊的應用前景,隨著研究的不斷深入和技術的更加完善基因芯片一定會在生命科學研究領域發(fā)揮越來越重要的作用。