發表日期 4/1/2022, 1:53:02 PM
夢晨 發自 凹非寺
量子位 | 公眾號 QbitAI
人類基因組測序迎來新的裏程碑!
首個 完整無間隙 人類基因組測序,由近百位科學傢閤作完成,填補上最後 8% 的空缺。
最新一期 Science 罕見地以特刊形式 連發6篇 論文,另外兩篇介紹研究方法的論文同日登上Nature Method。
作者之一、華盛頓大學教授 Evan Eichler 稱:
我們在生命天書中讀到瞭前所未有的新章節。
迴看2003年, 人類基因組計劃 (Human Genome Project)首次完成92%的人類基因測序,創造瞭曆史。
到如今,新成立的 端粒到端粒聯盟 (T2T Consortium)填補上最後8%的空缺,同時糾正瞭之前的一些錯誤,也將載入史冊。
△T2T聯盟部分成員
新確認的8%DNA片段裏包含重要的免疫反應基因,它們幫助人類適應和抵禦病毒和細菌感染,在預測藥物反應方麵很有價值。
聯盟發起人之一、馬裏蘭大學的 Adam Phillippy 認為,個人基因組測序在10年內有望普及, 個性化醫療 成本會大幅下降。
另外新發現的基因中有一些使得人類大腦比其他靈長類動物大腦更大,有助於進一步揭開 人類進 化之謎。
攻剋最後的8%
當初的人類基因組計劃由6國近2000位科學傢耗時13年完成,最後遺留的8%靠當時的測序技術難以突破。
原因有二:
其一,最後的8%裏有很多片段是重復的。
科學傢們用拼圖來形容這一睏難。如果拼圖裏好多小塊很相似就更難找到正確的位置。
近幾年發展齣的新測序方法 Oxford Nanopore 和 PacBio HiFi 可以一次處理更長的DNA片段,就好像拼圖的塊變大,塊數變小瞭。
其二,很難找到隻有一套DNA的人類細胞。
正常細胞同時擁有兩套DNA,分彆來自父親和母親,測序時兩組DNA混在一起增加瞭難度。
這次的解決辦法是使用一組來自 “葡萄胎” 的細胞,這是一種罕見妊娠疾病,使胚胎細胞異常生長,隻保留一套DNA。
用上新方法,人類DNA序列中 30.55億 個堿基對的測序工作終於宣告完工。
人類基因組計劃前負責人 Robert Waterston 對新方法評價到:
(人類基因組)不再有任何隱藏的或未知的部分。
全新的人類參考基因組被命名為 T2T-CHM13 ,今後的個性化基因測序可以此為基準,鎖定病變基因,提前預防和治療。
這次研究成果幾個月前已發布在生物預印本平台,現在正式見刊Science。
具體到已發錶的內容上,還存在一點不足之處:
使用的葡萄胎細胞保留的是XX染色體,缺失瞭 Y染色體 。
不過後來這段時間科學傢們也沒閑著,Y染色體的測序工作其實也另外完成瞭。
項目負責人 Adam Phillippy 在社交媒體宣布瞭這一消息,人體24條染色體基因測序已全部完成。
最新參考序列 T2T-CHM13 v2.0 的完整數據和在綫瀏覽器已公開,可供全球研究團隊使用。
而最新包含Y染色體測序成果的論文預印版計劃在下個月發布。
論文地址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0相關數據和工具
https://genomeinformatics.github.io/CHM13v2/