發表日期 4/1/2022, 12:25:11 PM
今天淩晨,《科學》雜誌一連上綫瞭6篇論文, 第一次公布瞭人類基因組的完整序列 。這項跨越3年的研究成果,填補瞭20年前測序結果留下的空白,是人類基因組研究的一個重大裏程碑。
這次的完整測序和分析,是114位科學傢共同完成的。這些科學傢來自不同國傢的33個科研機構,他們也被稱為“ 端粒到端粒聯盟 ”(Telemere-to-Telomere Consortium, T2T)。
填補8%的空白
對人類基因組的研究,已經有50多年的曆史。其中最有名的研究項目,是1990年啓動的“ 人類基因組計劃 ”。2003年4月14日,多國實驗室耗費10多年的時間和30億美元的資金,完成瞭人類基因組計劃的測序工作, 首次繪製齣瞭人類基因組的圖譜 。當時的測序工作,大大推動瞭基因組學的研究,增加瞭我們對人體和疾病的理解。
但是,當時人類基因組計劃得齣的序列中,仍然 留下瞭大約8%的空白 ,其中包含瞭很多高度重復的DNA序列,加起來有一條染色體那麼長。
人類的1至22號染色體 | Andreas Bolzer et al.
這8%的缺失,源於20年前測序技術的限製。當時使用的測序方法是 “短讀長測序”技術 (“short-read" technology),一次隻能讀取很短的一段基因序列。打個比方,如果把基因組的一部分想象成段落中的一句話,比如“今天早上小明吃瞭個包子”,通過短讀長測序,研究者能得到很多簡短的小部件,比如“今天”、“小明”、“明吃”、“包子”;再經過“拼圖”式的分析,他們就可以拼湊齣這句完整的話。
然而,研究者雖然能知道這段基因裏含有的簡短小序列, 卻無法知道這段基因被重復瞭多少次 。也就是說,研究者能夠拼湊齣“今天早上小明吃瞭個包子”這句話,但卻不知道這句話在整個段落裏是否重復齣現、重復瞭多少次。正因缺少這些信息,在過去的20年裏,重復序列一直是基因組學研究的一大難題。
直到兩種新技術誕生,人類基因組學的研究纔迎來瞭轉摺點。這兩種技術都屬於 “長讀長測序”技術 (“long-read" technology),一種是牛津納米孔測序(Oxford Nanopore DNA sequencing),它可以一次讀取多達100萬個DNA堿基,準確度中等;另一種是PacBio HiFi測序,一次隻能讀取2萬個堿基,但準確度近乎完美。這兩種技術,都可以 一次性測齣大塊的DNA序列 ,研究者可以直接看到一整個句子甚至段落,也就能知道某個序列連續重復瞭多少次。
T2T聯盟的聯閤主席凱倫・米加(Karen Miga)和亞當・菲利比(Adam Phillippy)| T2T Consortium
從2019年初開始,T2T聯盟的科學傢將這兩種新技術結閤起來,緻力於攻剋這些重復序列,填補缺失的空白。2020年底,他們公布瞭階段性成果――X染色體和8號染色體的完整組裝。經過之後2年的努力,現在, 他們終於揭開瞭真正完整的人類基因組序列,從端粒到端粒,包含瞭每一條染色體。
看到全部的基因遺産
2001年,人類基因組計劃公布的參考基因組被稱為GRCh38,之後又在不斷地被完善和修改;這一次,T2T聯盟公布的新參考基因組叫做T2T-CHM13,是GRCh38的升級版。 新增加的DNA序列總計近2億個堿基對 ,不僅填補瞭之前空缺的5個染色體短臂,還揭曉瞭基因組中最復雜的區域――在端粒和著絲粒周圍的高度重復的DNA序列。
用HiFi測序測齣的CHM13基因組的示意圖 | 參考文獻[1]
這次完整測序,還糾正瞭以前的很多錯誤,比如一些之前沒能被檢測到的片段重復。這些長鏈重復DNA曾被認為是基因組裏的“垃圾區”,沒有什麼實際的作用。但是,近年來,越來越多的研究都錶明, 這些重復序列對人類的進化和疾病可能是非常重要的 。這一次,科學傢們找到瞭基因組的最後一塊拼圖,終於拼湊齣瞭打開寶箱的鑰匙,接下來就可以研究其中尚未為人所知的寶藏瞭。
參與此次研究的其中一個實驗組,來自美國加州大學聖剋魯斯基因組學研究所。研究所所長大衛・豪斯勒(David Haussler)說:“ 現在我們可以站在山頂,俯瞰下麵的所有景色,看到我們人類全部的基因遺産。 ”
完整基因組數據已經在NCBI和GitHub上公開 | NCBI
下一步, 研究者們將會重點關注從前難以研究的重要區域,比如著絲粒 。這次新增加的基因組序列,90%都來自著絲粒。著絲粒對基因信息的遺傳極為重要,在減數分裂中,成對染色體就是從著絲粒開始分裂的。科學傢認為,很多與疾病相關的基因變異,就藏在著絲粒的長段重復DNA之中。
科學傢們還將嘗試測序齣更多的完整基因組。T2T會和人類泛基因組參考聯盟(Human Pangenome Reference Consortium)閤作, 計劃測齣350個人的完整基因組序列 ,創建一個“人類泛基因組參考”,從基因組的角度來呈現和解讀人類種群的多樣性。
T2T 聯盟的聯閤主席亞當・菲利比(Adam Phillippy)認為,完整基因組的測序和分析,對每個人都有好處。在不久的將來,對一個人的完整基因組測序會變得更便宜、更簡單,研究者和醫護人員也能從中識彆齣所有的基因變體,找到與疾病有關的部分,從而為人們的醫療與生活提供建議。
參考文獻
[1]https://www.biorxiv.org/content/10.1101/2021.05.26.445798v1
[2]https://www.eurekalert.org/news-releases/946948?
[3]https://www.eurekalert.org/news-releases/947718
[4]https://www.eurekalert.org/news-releases/947629
[5]https://www.eurekalert.org/news-releases/947636
[6]https://www.eurekalert.org/news-releases/947910
作者:貓吞
編輯:麥麥
本文來自果殼,未經授權不得轉載.