起源于幾千年前的中國古代哲學思想“陰陽”,為今天的大數據研究提供了靈感。4月25日,《自然-計算科學》發表一項來自深圳的最新成果,該研究開創了一套獨具優勢的“陰陽”編解碼系統,用以解決當前DNA信息存儲領域的技術難題。
研究由深圳華大生命科學研究院主導,深圳國家基因庫、首都師范大學、美國哈佛大學等多個研究團隊共同參與。
存儲信息,DNA是“資深前輩”
我們正處在前所未有的信息大爆炸時代。據估算,2025年全球每天將產生491EB數據,相當于每天制造出2億張DVD光盤。如此海量數據,如何長期穩定存儲?
2019年,“DNA數據存儲器”入選《時代周刊》年度100項最佳發明。
如何用DNA存儲數據?華大相關負責人用一句話進行了解釋。所有信息在計算機中由二進制的方式存儲,即0和1兩個數碼;而儲存在DNA中的生物遺傳信息,則以A、T、G、C四種堿基表現。“如果把信息語言的0和1,轉換為生物語言的ATGC,DNA就有望成為‘完美’存儲器了。”該負責人說。
事實上,在信息存儲界,相較于現有的U盤、硬盤、磁帶等,DNA可以說是坐擁數十億年經驗的資深前輩。
第一是超高的信息密度,2012年《科學》雜志文章指出,1克DNA理論上可以存儲455EB數據,相當于數千萬個1TB移動硬盤的大小;第二是超長的待機時間,DNA作為相對穩定的分子,其半衰期長達521年,在理想狀態下甚至可保存成千上萬年;第三是超強的生物兼容性,DNA作為絕大多數生物遺傳信息的載體,相對無機物、金屬等存儲介質而言,具有更強的生物兼容性。
“陰陽”思想,解DNA存儲難題
“DNA的雙鏈模型,是否能如‘陰陽’一樣對立、統一和互化?”基于此,研究團隊開創了一套名為“陰陽”的比特-堿基編解碼系統,驗證了該系統在信息密度、技術兼容性、數據恢復穩定性等多方面的優勢。
“我們以兩套不同的規則,分別對兩條二進制信息進行‘一對一’編譯轉換,再取兩者統一交集的部分,實現將兩條獨立的信息組合統一為一串DNA序列。”華大相關負責人表示。
據悉,目前常用的保存方法分為體內和體外兩種模式,兩者孰優孰劣尚未形成明確定論。為了全方位驗證“陰陽”系統的信息恢復穩定性,華大研究院團隊通過體外DNA干粉和細胞體內大片段兩種存儲環境進行測試,皆實現了原始存儲數據的完整恢復。(記者 袁斯茹)