哈佛大學(xué)研究人員將一本大約有5.34萬個單詞的書籍編碼進(jìn)不到億萬分之一克的DNA微芯片,然后成功利用 DNA 測序來閱讀這本書。“今后,拇指大小的設(shè)備就能存下整個互聯(lián)網(wǎng)的信息。”該項目的首席研究員、哈佛大學(xué)遺傳學(xué)家喬治·丘奇說。要說信息存儲,沒有一樣比得過 DNA。人們很早就覬覦我們自身的基因代碼存儲數(shù)據(jù)的潛力,但如何將信息編碼進(jìn) DNA 遺傳物質(zhì)再如何解讀出來,一直是個難題。
這是迄今為止人類使用DNA遺傳物質(zhì)儲存數(shù)據(jù)量最大的一次實驗。
近日,哈佛大學(xué)維斯生物工程研究所的一群研究人員嘗試將一本大約有 5.34 萬個單詞的書籍編碼到不到一沙克(億萬分之一克)的DNA微芯片中,連同文字一起的還有11張圖片和一段Java程序。這是迄今為止人類使用DNA遺傳物 質(zhì)儲存數(shù)據(jù)量最大的一次實驗。“今后,拇指大小的設(shè)備就能存下整個互聯(lián)網(wǎng)的信息。”該項目首席研究員、哈佛大學(xué)遺傳學(xué)家喬治·丘奇(George Church)說,被編碼進(jìn) DNA 的書正是他的大作《再生:合成生物學(xué)將如何改變未來的自然和自己》。
這項實驗被刊登在《科學(xué)》期 刊上。但因編碼存儲和讀取過程太過昂貴,DNA 存儲離商業(yè)化還有一段距離。“隨著DNA合成、測序價格的不斷下降,這或許將成為長期存儲數(shù)據(jù)的一種選擇。”哈佛大學(xué)生物學(xué)教授可蘇里(Sriram Kosuri)說。這一實驗,或許為解決未來社會爆炸性的大數(shù)據(jù)存儲指明了方向。
從二進(jìn)制到堿基對編碼
DNA 是生物數(shù)據(jù)庫,它的主要功能就是存儲包含各種指令的生物信息。DNA 有 G(鳥嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四種堿基,共同構(gòu)成了相互纏繞的雙鏈階梯狀的螺旋結(jié)構(gòu)。通過這四種堿基不同順序的編碼,存儲了生物所有的遺傳信息。
現(xiàn)代計算機(jī)技術(shù)奠基者之一馮·諾依曼曾在 1948 年提出“自動復(fù)制機(jī)器”的設(shè)想:一個能夠自我繁殖的系統(tǒng),不僅能夠構(gòu)建某個組成元素,結(jié)構(gòu)和自己一致的下一代,也能夠把對自身的描述傳遞給下一代,如此往 復(fù)。后來隨著生物遺傳的奧妙被發(fā)現(xiàn),人們意識到,DNA 雙螺旋結(jié)構(gòu)正是馮·諾依曼描述的自動復(fù)制機(jī)器。
另一種主流的光存儲也在不斷挑戰(zhàn)存儲極限。光盤將數(shù)字編碼的視頻和音頻儲存在光盤表面的凹槽中。激光讀取這些凹槽的背面,就能播放儲存的電影節(jié) 目。光盤包含的數(shù)據(jù)越多,凹槽就必須越小、越緊湊。與之相對,讀取激光的精度也必須越來越高。普通 DVD 使用的是紅色激光在凹槽里記錄信息,藍(lán)色激光波長比紅色激光長,較小的光束聚焦更準(zhǔn)確。此外,藍(lán)光光盤將軌距從 0.74 微米縮小到 0.32 微米。更小的凹槽,更小的光束以及更短的軌距結(jié)合,藍(lán)光的問世正是順應(yīng)了大數(shù)據(jù)存儲的潮流。現(xiàn)在單層藍(lán)光光盤能夠保存 25GB 以上的信息,是 DVD 可儲存信息量的5倍。還有人在研發(fā)用紫外線做激光,其波長比藍(lán)光更短,如果成功,一張光盤可以保存 500GB 的數(shù)據(jù)。
這些存儲方 式有一個共同的缺點,磁片表面也好,光盤表面也好,都是單層的平鋪式地記錄和保存信息,哪怕磁盤每一層可以疊加,也和 DNA 封閉的雙螺旋立體結(jié)構(gòu)無法媲美,記錄的數(shù)據(jù)量相去甚遠(yuǎn)。一克 DNA 即能儲存上千億個千兆字節(jié),相當(dāng)于 1000 億張 DVD 光盤的內(nèi)容。
隨著摩爾定律的升級,人們已經(jīng)逐步接近傳統(tǒng)電子制造的極限。人們早就開始在自然中尋找解決問題的靈感。早在 2007 年,就有日本科學(xué)家研究利用趨磁細(xì)菌制造出和傳統(tǒng)計算機(jī)原件類似的東西,代替磁盤存貯數(shù)據(jù)。今年初,又爆出德國和臺灣的一個聯(lián)合科研團(tuán)隊以三文魚的 DNA 作為基礎(chǔ),制造出單次寫入多次讀取的存儲器。不過,那個 DNA 存儲裝置只能儲存數(shù)據(jù)至多 30 小時,且它并沒有利用 DNA 的結(jié)構(gòu)進(jìn)行編碼。
這是個數(shù)據(jù)爆炸的時代,無處不在的攝像頭,互聯(lián)網(wǎng)上成倍增長的信息,大量手持設(shè)備的照片、視頻??如果生物存儲技術(shù)足夠成熟,人們可以記錄所有想記錄的一切,而不必?fù)?dān)心家里沒有地方放硬盤。市政部門也不必每隔一段時間就清理街道攝像頭的視頻記錄,釋放存儲空間。
微流體和芯片實驗室的發(fā)展,讓 DNA 合成和測序變成一項日常工作。以前,要解碼一個人類基因得花幾年,現(xiàn)在用微流體芯片技術(shù)只要不到一天。如果用于長期存儲,這樣的速度還是可以接受的。隨著 DNA 讀寫技術(shù)的商業(yè)化,未來的 DNA 硬盤,或許會和今天的硬盤、光碟一樣普遍。