中國科學(xué)家創(chuàng )新DNA存儲算法讓敦煌壁畫(huà)再“活”兩萬(wàn)年

時(shí)間:2022-10-10 11:24來(lái)源:大西北網(wǎng) 作者:中國青年報 點(diǎn)擊: 載入中...
  
  DNA存儲的敦煌壁畫(huà)。天津大學(xué)供圖

  
  DNA存儲技術(shù)概念圖。天津大學(xué)供圖

  
  基于德布萊英圖理論設計的序列重建算法高效解決DNA斷裂、降解問(wèn)題。天津大學(xué)供圖
  
  科幻大片《侏羅紀公園》里講述了這樣一個(gè)故事:科學(xué)家找到一塊有史前蚊子的琥珀,從蚊子血中獲得了恐龍的基因,從而讓已滅絕了6000多萬(wàn)年的恐龍復活。
  
  恐龍的生物信息存儲在DNA中,若干年后被提取并還原出來(lái)。這聽(tīng)上去似乎有些道理,卻也讓人倒吸一口涼氣。
  
  最近,天津大學(xué)一項研究成果讓人們離想象又近了一些。該校合成生物學(xué)團隊將10幅精選敦煌壁畫(huà)存入DNA中,并通過(guò)加速老化等實(shí)驗,發(fā)現這些壁畫(huà)信息在常溫下可保存千年,在9.4℃下可保存兩萬(wàn)年。
  
  “如果在合適的溫度等條件下,保存千萬(wàn)年也是可以的。”中國科學(xué)院院士、天津大學(xué)副校長(cháng)元英進(jìn)說(shuō)。
  
  小小的DNA卻擁有驚人的存儲容量
  
  人類(lèi)文明進(jìn)化史,也是一部信息存儲技術(shù)發(fā)展史。
  
  從結繩記事、倉頡造字到磁帶、硬盤(pán)等現代磁光電存儲技術(shù),數據存儲幫助人類(lèi)延續了思想,記錄下?tīng)N爛文明。造紙與印刷術(shù)的發(fā)明,讓人類(lèi)能夠存儲的數據量在幾百年內獲得了大約5個(gè)數量級的提升。到了計算機時(shí)代,人類(lèi)產(chǎn)生的數據呈爆發(fā)式增長(cháng)。
  
  “全世界都在建數據中心,而數據中心的能耗是驚人的。”元英進(jìn)說(shuō)。人們一直在不斷尋找更海量、更穩定、更安全的存儲方式。
  
  大自然鬼斧神工的絕妙之處就在于此——最好的存儲器或許就藏身于生命體之中。
  
  自地球上出現生命以來(lái),大自然一直用DNA來(lái)存儲信息,至今已有30多億年。人類(lèi)的五官在臉上如何擺放,體內的蛋白怎樣合成,眼睛是什么顏色……諸如此類(lèi)紛繁復雜的人類(lèi)基因組信息,都記錄在比細胞還小得多的DNA上,一代代沿用至今。
  
  不同于各種人造存儲設備,DNA極其精巧卻又如此經(jīng)久耐用,它存儲了億萬(wàn)年來(lái)無(wú)數生物的遺傳信息,造就生命繁衍、進(jìn)化演化及生物多樣性。
  
  那么,假如把海量的信息,像存入U盤(pán)、硬盤(pán)一樣,“寫(xiě)”到小小的DNA上,豈不是一舉多得?事實(shí)上,當人類(lèi)發(fā)現DNA的雙螺旋結構后,美俄科學(xué)家就先后提出了用DNA存儲數字信息的概念。
  
  元英進(jìn)解釋說(shuō),DNA存儲相較于磁、光、電等常規的信息存儲介質(zhì)有3個(gè)最顯著(zhù)的優(yōu)勢。其中最大的優(yōu)勢在于存儲密度高。目前,天津大學(xué)研究團隊將部分經(jīng)典視頻片段存儲在DNA中,已實(shí)現了體積存儲密度比普通硬盤(pán)高出6個(gè)數量級。
  
  與此同時(shí),存儲的信息可用時(shí)間非常長(cháng)。此次研究者將10幅敦煌壁畫(huà)信息存儲在DNA中,結合創(chuàng )新的算法,可以實(shí)現DNA分子在室溫下保存超過(guò)千年,在9.4℃條件下保存兩萬(wàn)年。
  
  這樣的長(cháng)期保存需要的能耗卻很低。元英進(jìn)認為,DNA存儲被視為一種極具潛力的存儲技術(shù),已經(jīng)成為應對數據存儲增長(cháng)挑戰的新機遇。
  
  壁畫(huà)“變身”DNA需要幾步
  
  DNA信息存儲的原理共分兩步——信息寫(xiě)入和信息讀取。
  
  這個(gè)過(guò)程實(shí)際上跨越了極難逾越的鴻溝:它打破了有機與無(wú)機的界限,連起生命和信息兩大系統。
  
  DNA是脫氧核糖核酸的縮寫(xiě),含有“A”“T”“C”“G”四種堿基。如果用數字中的0、1、2、3分別代表一個(gè)堿基,就組成了一個(gè)四進(jìn)制的存儲方式,類(lèi)似于計算機采用的0和1二進(jìn)制代碼。
  
  通過(guò)編碼轉化,“堿基四進(jìn)制”和“計算機二進(jìn)制”就可以實(shí)現“對話(huà)”。天津大學(xué)合成生物學(xué)前沿科學(xué)中心博士生韓明哲解釋說(shuō),壁畫(huà)的數字圖像本質(zhì)上就是二進(jìn)制的比特串,“我們通過(guò)編碼將這些二進(jìn)制的比特串,轉化為四進(jìn)制的ATGC堿基序列,再通過(guò)DNA合成技術(shù)將堿基序列寫(xiě)入DNA中,壁畫(huà)的數據圖像就‘變’為DNA了。”
  
  此前,該團隊成功在釀酒酵母中合成了一條額外的人工染色體,并在上面存儲了兩張圖片及一段視頻信息,將其稱(chēng)之為“酵母CD”。隨著(zhù)酵母的不斷繁殖擴增,數字信息也隨之廉價(jià)且穩定地復制。
  
  “我們傳代培養酵母到100代,依然可以完美地恢復出原始數據。”元英進(jìn)說(shuō),假如腦洞更大一點(diǎn),將信息存儲到一棵樹(shù)中,隨著(zhù)樹(shù)生長(cháng)千百年,人類(lèi)的子孫后代都可以隨時(shí)從這棵樹(shù)中讀取到千百年前存儲的信息。
  
  這一次,這支年輕團隊的創(chuàng )新之處在于,能實(shí)現更惡劣條件下可靠讀取信息。韓明哲說(shuō),存了壁畫(huà)信息的DNA,本質(zhì)上其實(shí)跟天然的DNA沒(méi)有什么不同,同樣也存在長(cháng)時(shí)間存放而產(chǎn)生的斷裂和降解等問(wèn)題,影響信息存儲的長(cháng)期可靠性,這也成為亟待解決的關(guān)鍵科學(xué)問(wèn)題。
  
  于是,他們設計了基于德布萊英圖理論的序列重建算法來(lái)解決DNA斷裂等問(wèn)題,可以從嚴重降解的DNA樣本中,恢復原始的信息。
  
  為了驗證數據的長(cháng)期可靠性,團隊制備了一個(gè)沒(méi)有任何特殊保護的DNA水溶液樣本,隨后在70℃的溫度下加速樣本斷裂、降解長(cháng)達十周。韓明哲說(shuō):“這個(gè)過(guò)程使得DNA片段80%以上都發(fā)生了斷裂錯誤,模擬了DNA在自然環(huán)境下千年萬(wàn)年的降解情形。”
  
  隨后,團隊依靠設計的序列重建算法,依然可以準確組裝并解碼96.4%以上的片段,再通過(guò)一種編碼方式解決了少量片段丟失的問(wèn)題,使原始的敦煌壁畫(huà)圖片能夠完美恢復。
  
  DNA存儲走向實(shí)用化還有多遠
  
  盡管DNA存儲還不被大眾所熟知,但它正在努力走出實(shí)驗室,“距離實(shí)用化并不遙遠。”元英進(jìn)說(shuō),驚人的數據存儲需求是新技術(shù)走向市場(chǎng)的最大推動(dòng)力。
  
  據國際數據公司估計,到2025年全球數據總量將達到175ZB(1ZB為十萬(wàn)億億字節)。到2024年,全球將有30%的數字業(yè)務(wù)進(jìn)行DNA存儲試驗。然而從目前來(lái)看,DNA存儲想要大規模應用,尤其是在中國實(shí)用化還需要突破幾個(gè)關(guān)鍵瓶頸。
  
  團隊分析了當前DNA信息存儲面臨的主要挑戰。信息存儲成本高、信息讀寫(xiě)速度慢,以及無(wú)法高效對接現有信息系統是三大主要限制因素。
  
  根據測算,目前DNA存儲寫(xiě)入成本相當于20世紀80年代內存的存儲成本,而要達到當前數據存儲成本還需要降低7-8個(gè)數量級。
  
  “DNA信息存儲成本在未來(lái)有很大下降的潛力。”韓明哲認為,今后可以從優(yōu)化合成反應、改良芯片結構、替換廉價(jià)耗材、優(yōu)化試劑分配量等方面著(zhù)手,大幅降低合成成本。
  
  與此同時(shí),由于信息存儲領(lǐng)域市場(chǎng)規模巨大,隨著(zhù)半導體器件、微納加工在DNA信息存儲領(lǐng)域的應用,該領(lǐng)域的巨大投入將對DNA合成技術(shù)產(chǎn)生重大影響,DNA合成技術(shù)與裝備快速迭代升級,也有望使成本快速下降。
  
  DNA信息存儲的讀取依賴(lài)測序技術(shù),與磁、光、電等存儲相比,讀取速度較慢。目前DNA測序儀的讀取速度與硬盤(pán)相比,還存在3-4個(gè)數量級的差距——現有電、磁存儲技術(shù)通常每秒可讀取幾十到幾百兆字節數據。此外,DNA存儲的標準尚待建立,面臨與現有數字存儲系統兼容的問(wèn)題。
  
  “DNA信息存儲是一個(gè)新興的、多學(xué)科深度交叉融合的研究方向。”元英進(jìn)認為,DNA存儲在未來(lái)極有可能成為龐大冷數據存儲的主要存儲介質(zhì)。
  
  所謂冷數據,就如同檔案館的歷史資料,需要把海量信息保存好,但平時(shí)又很少去使用。因為這些數據需要長(cháng)期存儲、耗能又大,而電子存儲設備的壽命往往只有十年到幾十年,并需要不斷更新迭代,難以滿(mǎn)足冷數據存儲的需要。
  
  DNA存儲走向實(shí)用化仍面臨很多挑戰。元英進(jìn)認為,眼下的突破可能還只是冰山一角,“技術(shù)進(jìn)步需要十年磨一劍的耐心,還需要一點(diǎn)運氣。”(胡春艷通訊員趙暉)












 
(責任編輯:張云文)
>相關(guān)新聞
  • 中國科學(xué)家創(chuàng )新DNA存儲算法讓敦煌壁畫(huà)再“活”兩萬(wàn)年
  • 中國科學(xué)家在新一代干細胞制備技術(shù)上取得重要突破
  • 勇攀高峰,為實(shí)現高水平科技自立自強貢獻力量--各地貫徹黨的
  • 我國互聯(lián)網(wǎng)產(chǎn)業(yè)穩步發(fā)展 成為引領(lǐng)創(chuàng )新和驅動(dòng)發(fā)展動(dòng)力源
  • 實(shí)現“雙碳”目標需加強創(chuàng )新
  • 實(shí)現“雙碳”目標需加強創(chuàng )新
  • 頂一下
    (0)
    0%
    踩一下
    (0)
    0%
    ------分隔線(xiàn)----------------------------
    推薦內容
    ?
    網(wǎng)站簡(jiǎn)介??|? 保護隱私權??|? 免責條款??|? 廣告服務(wù)??|? About Big northwest network??|? 聯(lián)系我們??|? 版權聲明
    隴ICP備13000024號-1??Powered by 大西北網(wǎng)絡(luò ) 版權所有??建議使用IE8.0以上版本瀏覽器瀏覽
    Copyright???2010-2014?Dxbei Corporation. All Rights Reserved
    亚洲成AV人片一区二区小说_26uuu另类亚洲欧美日本_人妻精品动漫H无码专区_亚洲中文字幕超碰无码资源