外媒:人類“完整說明書”出爐 全部基因組測序完成
2021年06月16日19:17

原標題:外媒:人類“完整說明書”出爐 全部基因組測序完成 來源:參考消息網

參考消息網6月16日報導 西班牙《國家報》網站6月3日發表題為《一個國際聯盟完成迄今最全面人類基因組測序》的報導稱,人類無知的真實程度只能隨著時間的推移而被感知。人類曾在不知道微生物存在的情況下長期生活,直到17世紀荷蘭布商安東尼·列文虎克用他自製的顯微鏡觀察到了用肉眼無法看到的微小生物。如今,另一項巨大的技術進步使得首次獲得人類基因組的完整序列成為可能。人類已經等了30萬年才能看到自己的“完整說明書”。

改變醫學未來

約20年前,一個龐大的國際科學團隊公佈了人類基因組序列的草圖,但那個版本充滿漏洞。美國生物信息學家亞當·菲利皮將這項任務比作一幅風景畫拚圖,其中還缺少藍色天空的圖塊。

報導稱,另一個大型科學團隊,即“端粒到端粒”聯盟,現已發佈了人類基因組的“第一個真正完整的測序”。科學家對人類基因組全部30.55億個堿基對進行了測序。在此前的測序中,約有8%的序列缺失或錯誤。

這些序列中包含著各種“說明”,例如,大腦中的神經元知道如何傳遞想法。人類擁有數萬個基因,它們被儲存於細胞中心的脫氧核糖核酸(DNA)分子中。基因信息以四種堿基(C、G、T和A)的形式存在,每兩個堿基形成堿基對。當前的大規模測序技術(用於醫院研究具有遺傳性的疾病)不能一次讀取很長的人類基因組,但可以識別幾百個字母的片段,然後通過參考基因組進行排列。

報導稱,當排列高度重複的DNA片段(如ATATATATATAT)時,問題就出現了,這就像風景拚圖中的藍天圖塊一樣難以排序。為了繞過這個障礙,研究人員使用了尖端技術,例如來自英國牛津納米孔公司的測序儀,這些設備通過一個小孔能夠一次讀取數十萬個字母。

“端粒到端粒”聯盟由美國加利福尼亞大學聖克魯斯分校的卡倫·米加和美國國家人類基因組研究所的亞當·菲利皮領導。該聯盟成員認為,這開啟了基因組學研究的“一個新時代”,在這個時代中,沒有任何基因組區域是遙不可及的。該研究作者於5月27日發表了他們的測序結果草圖。有了他們的新數據,人類基因組的基因數量將達到19969個,其中百餘個是由“端粒到端粒”聯盟發現的。

報導稱,來自西班牙巴塞羅那基因組中心的荷蘭專家勒妮·比克曼對這項新研究表示讚賞。“這些缺失的部分是尋找可能導致疾病(如癌症)的DNA錯誤的新前沿,”這位研究人員說,“此前,我們對這些區域一無所知,但這項研究提供了研究它們所需的信息和工具。”

比克曼指出,“端粒到端粒”聯盟僅從一名女性的細胞中獲取了DNA,因此該測序還無法區分人與人之間的差異,而且也缺乏僅存在於男性體內的Y染色體的信息。這位荷蘭科學家說:“該研究的作者使用的技術是在不久的將來獲得這些信息的大有前途的工具。”

另據美國《大眾機械》月刊網站6月3日報導,21年前,研究人員曾公佈人類基因組的第一份測序草圖。這是一項巨大的成就,但是該序列仍然缺失了基因組大約8%的測序結果。

現在,世界各地通力合作的科學家們表示,他們終於補上了這來之不易的8%。

報導稱,如果他們的研究結果經得起同行審查,而且事實證明他們確實完成了對人類基因組全部的測序和彙編——包括其中所有的空缺,那麼這可能改變醫學的未來。

完成宏大工程

很長時間以來,人類基因組的測序一直是一項具有重要目標的宏大工程。為什麼?因為隨著人類對自身遺傳密碼瞭解程度的提高,可以製造出更好、更定製化的藥物,例如那種曾推動首批有效的新冠病毒疫苗誕生的基因類醫學技術。

報導稱,人類擁有46條染色體,分成23對,它們由數以萬計的單個基因組成。每個基因包含若干數目的堿基對,而堿基對則由腺嘌呤(A)、胸腺嘧啶(T)、鳥嘌呤(G)、胞嘧啶(C)組成。人類基因組中存在數十億個堿基對。

2000年6月,“人類基因組計劃”和私營企業美國塞萊拉基因組公司曾宣佈了人類基因組的第一份草圖。這是工作多年的成果,而人類持續製造出更出色的計算機和算法來處理基因組加快了工作速度。當時,讓科學家們感到驚訝的是,在30多億個獨立的堿基對“字母”中,估計人類只有3萬到3.5萬個基因。而今天,這個數字比當時的估計低了很多,約為2萬。

3年後,人類基因組計劃結束了其繪製人類基因組整體圖譜的使命,並以如下方式作出解釋:

報導稱,“‘完成的序列’是一個技術性術語,意為該序列極為精確(堿基對字母的錯誤率低於萬分之一)和具有高度連續性(僅餘的空缺對應的是那些用現有技術無法可靠完成測序的區域)。”

在這裏,“現有技術”成為關鍵字眼。當時,人類基因組計劃使用了一種被稱為細菌人工染色體的方法:科學家利用一種細菌複製出基因組的每一個片段,然後對它們分組研究。完整的“細菌人工染色體資料庫”則是2萬個精心培育、內含複製基因的細菌。

但是,這種方法勢必會漏掉完整基因組的某些部分。而其原因恰恰成為引導新的科學家團隊合力完成這一成就的重要線索。

引發技術突破

2000年版基因組草圖未曾觸及的那隱秘的8%中究竟隱藏著什麼?這部分基因組中的堿基對由許許多多重複的模式組成,這些模式使其變得難以操縱,從而無法採用細菌複製法加以研究。

細菌人工染色體等方法根本不適用於存在大量重複模式、賸餘的8%基因組。美國斯塔特網站的資深撰稿人馬修·赫珀說:“當前主力DNA測序儀是由美國伊盧米納公司生產的,方法是提取微小的DNA碎片,對它們進行解碼,並重新組裝拚圖。這種方法對於基因組的大多數部分很管用,但是對於DNA編碼大段重複的區域卻並不管用。”

報導稱,這從直覺上是說得通的:想像從1數到50與簡單地一遍又一遍重複1、2、1、2……之間的不同。使細菌人工染色體方法獲得成功的部分原因是科學家小心翼翼地把重疊部分減至最少,並加以匹配,而在有著很多重複、尚未被研究過的那部分基因組中,這幾乎不可能。

那麼,新方法有什麼不同呢?讓我們先來看看它們的原理是什麼。總部在美國加利福尼亞州的太平洋生物科技公司和總部在英國的牛津納米孔公司採用了不同技術,但奔向同一目標。

報導稱,太平洋生物科技公司採用一種被稱為“高保真”的系統,在該系統中堿基對被循環排列——真的像圓環一樣,直到它們被全部和高保真地讀取(於是便有了那個名字)。該系統的歷史只有短短幾年,但在讀取那些較長序列時,無論是讀取的長度還是準確率都邁出一大步。

牛津納米孔公司則在其專利裝置中採用了電流。一條條堿基對鏈被擠壓穿過顯微納米孔,每次僅一個分子,在那裡以電流作用於它們以便觀察它們是什麼類型的分子。通過對每個分子施加電流,科學家可以識別完整的堿基對鏈。

報導稱,這項新研究發表在生物學論文預印本網站美國生物學論文檔案網,在這項研究中,一個由大約100名科學家組成的國際聯合團隊同時採用了太平洋生物科技公司和牛津納米孔公司的技術,以找出人類基因組中某些仍然不為人知的片段。

該聯合團隊搜尋的範圍大得驚人。斯塔特網站報導稱,“聯合團隊表示,他們將DNA堿基的數量從29.2億個增加到了30.5億個,增幅為4.5%。但是,基因的個數隻增加了0.4%,增至19969個”。這表明,與它們所構成的基因相比,這一區域中大量重複的堿基對序列的規模有多麼龐大。

報導稱,美國哈佛大學生物學家、測序技術之父喬治·丘奇告訴斯塔特網站,如果這項研究結果通過同行評審,這將是對脊椎動物基因組的首次完整繪製。而原因似乎僅僅在於兩種新技術都使得極長的堿基對鏈可以被立刻讀取。

為什麼缺失的基因信息如此重要?原因在於,基因研究存在諸多偏頗,少數最熱門的基因佔據著大部分的研究興趣和經費,而那些被忽視的基因往往掌握著大量關鍵機製,例如導致疾病的機製。

現在只存在一個小小的缺憾,不過這一缺憾在2000年宣佈的第一份基因組草圖中也同樣存在:兩個項目研究的細胞都只有23條染色體,而不是全部46條染色體。這是因為他們使用的是從生殖系統提取的細胞,而生殖系統的卵子和精子各攜帶全部染色體數量的一半。

報導稱,這種細胞來自葡萄胎,即精子和不含細胞核的卵細胞結合後沒有生命力的極早期發育形態。這種細胞被保存和培養為用於科研的“細胞系”,選擇這種細胞可以使測序的巨大工作量減少一半。

下一步是將這份研究報告發表在經過同行評審的出版物上。此後,太平洋生物科技公司和牛津納米孔公司都將尋求對46條染色體的人類基因組進行排序。但我們也許要等待一段時間。

關注我們Facebook專頁
    相關新聞
      更多瀏覽