日漸成熟的高通量測序技術
測序在生命科學研究中一直發揮著重要作用。以Sanger法(雙脫氧核苷酸末端終止法)為代表的第一代測序技術幫助人們完成了從噬菌體基因組到人類基因組圖譜等大量測序工作,但由于其存在成本高、速度慢、通量低等不足,并不是后基因組時代最理想的測序方法。
進入21世紀后,以Roche 454、Illumina Solexa和ABI SOLiD為代表的第二代測序技術誕生了,并迅速掀起了你追我趕的技術比拼高潮。2010年,Illunima和ABI先后發布新款測序儀,改進了原有機型,測序通量不斷提升,測序成本不斷降低,現在已經進入了數千美元測一個人全基因組的時代。
第二代測序技術進展
1. Roche 454測序技術
454公司可謂第二代測序技術的奠基者。2005年底,454公司推出了革命性的基于焦磷酸測序法的高通量基因組測序系統--Genome Sequencer 20 System。這一技術的建立開創了邊合成邊測序(sequencing by synthesis)的先河,被nature雜志以里程碑事件報道。之后,454公司被羅氏診斷公司以1.55億美元收購。一年后,他們又推出了性能更優的第二代基因組測序系統--Genome Sequencer FLX System(GS FLX)。2008年10月,Roche 454在不改變機器的情況下,推出了全新的測序試劑--GS FLX Titanium,全面提升了測序的準確性、讀長和測序通量。
目前,Roche 454 GS FLX Titanium每次運行能產生100萬條序列,平均讀長能達到400nt,且第400個堿基的準確率能達到99%。一次運行所需時間為10小時,能獲得4-6億個堿基的序列信息。
2. Illumina Solexa測序技術
Illumina公司的第二代測序儀最早由Solexa公司研發,利用其專利核心技術"DNA簇"和"可逆性末端終結(reversible terminator)",實現自動化樣本制備和大規模并行測序。Illumina公司于2007年初花費6億美金巨資收購了Solexa。2010年初,Illumina將其第二代測序儀Genome Analyzer IIx升級到HiSeq 2000。
HiSeq 2000含有兩張Flow cell,可同時運行或者只運行其中一張。讀長為100nt,同時支持Fragment、Pair-end和Mate-Paired文庫。每次運行最多可產生200 GB的數據量(讀長為2x100nt)。
3. ABI SOLiD測序技術
過去20年,美國應用生物系統公司(ABI)在一代測序方面一直占據著壟斷地位。第二代測序技術出現以來,ABI公司不甘落后,迅速趕上,于2007年底推出了SOLiD 第二代測序平臺。2010年末又發布了最新產品--SOLiD 5500xl測序平臺。從SOLiD到如今的SOLiD 5500xl,短短三年時間,連升五級,發展速度驚人。
SOLiD全稱為Supported Oligo Ligation Detetion,它的獨特之處在于它以四色熒光標記寡核苷酸的連續連接反應為基礎,而沒有采用傳統的邊合成邊測序技術。連接反應沒有DNA聚合酶合成過程中常有的錯配問題,而SOLiD特有的"雙色球編碼技術"又提供了一個糾錯機制,這樣設計上的優勢使得SOLiD在系統準確性上大大領先于其它平臺。
目前最新款SOLiD 5500xl含有兩張微流體芯片(microfluidic FlowChip),每張芯片含有6條相互獨立的運行通道(run lane)。每條lane都能運行相對獨立的測序反應,這樣的設計使得SOLiD 5500xl測序平臺極具靈活性。最大測序讀長為75nt,同樣支持Fragment、Pair-end和Mate-Paired文庫。單次運行能得到的最大數據量為300Gb(使用最新設計的nanobeads)。測序的系統準確性能達到99.99%。
第二代測序技術的應用
技術推進科學研究的發展。隨著第二代測序技術的迅猛發展,科學界也開始越來越多地應用第二代測序技術來解決生物學問題。比如在基因組水平上對還沒有參考序列的物種進行重頭測序(de novo sequencing),獲得該物種的參考序列,為后續研究和分子育種奠定基礎;對有參考序列的物種,進行全基因組重測序(resequencing),在全基因組水平上掃描并檢測突變位點,發現個體差異的分子基礎。在轉錄組水平上進行全轉錄組測序(whole transcriptome resequencing),從而開展可變剪接、編碼序列單核苷酸多態性(cSNP)等研究;或者進行小分子RNA測序(small RNA sequencing),通過分離特定大小的RNA分子進行測序,從而發現新的microRNA分子。在轉錄組水平上,與染色質免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術相結合,從而檢測出與特定轉錄因子結合的DNA區域和基因組上的甲基化位點。
這邊需要特別指出的是第二代測序結合微陣列技術而衍生出來的應用--目標序列捕獲測序技術(Targeted Resequencing)。這項技術首先利用微陣列技術合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區域互補結合,從而富集到特定區段,然后用第二代測序技術對這些區段進行測序。目前提供序列捕獲的廠家有Agilent和Nimblegen ,應用最多的是人全外顯子組捕獲測序。科學家們目前認為外顯子組測序比全基因組重測序更有優勢,不僅僅是費用較低,更是因為外顯子組測序的數據分析計算量較小,與生物學表型結合更為直接。
目前,外顯子組測序開始廣泛應用于尋找疾病的候選基因上。內梅亨大學的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導致嚴重的智力缺陷、腫瘤高發以及多種先天性畸形的罕見病。他們使用Agilent SureSelect序列捕獲和SOLiD對四位患者的外顯子組進行測序,平均覆蓋度為43倍,讀長為50 nt,每個個體產生了2.7-3 GB可作圖的序列數據。他們聚焦于全部四位患者都攜帶變異體的12個基因,最終將候選基因縮小至1個。而貝勒醫學院基因組測序中心也計劃對15種以上疾病進行研究,包括腦癌、肝癌、胰腺癌、結腸癌、卵巢癌、膀胱癌、心臟病、糖尿病、自閉癥以及其他遺傳疾病,以更好地理解致病突變以及突變對疾病的影響。前不久剛剛結束的Science雜志年度十大科學突破評選中,外顯子組測序名列其中。
以上我們盤點了2010年第二代測序技術的最新進展和相關應用。但是除了第二代測序之外,還有另外一種以單分子實時測序和納米孔為標志的第三代測序技術也正在如火如荼的發展中,只是還沒有正式發布。所以目前科學界所說的高通量測序還指的是第二代測序。

上一篇:科學家發現卵巢癌致病基因
下一篇:“餓死”癌細胞的小分子