
7個月后,這一爭論還沒有平息。一些學術期刊和無數的博客針對這個話題發表觀點。在4月8號,Ceurrent Biology雜志發表了關于該話題的第二篇文章,這一現象讓人不得不感到好奇,為什么“功能”這個簡單的詞語能引起如此大的分歧呢?
Encode項目是由美國NIH的國家人類基因組研究所(National Human Genome Research Institute)贊助,目的是對在人類基因組項目中產生的數據進行分析處理。不同的基因編碼了各種特定蛋白質,完成了細胞中的大部分功能,但這僅僅是少部分的基因,對于基因組中大部分序列的作用,科學家們并不知道。
因此,Encode項目幾乎分析了基因組中所有部分——尤其是其中不編碼蛋白質的98%,希望能夠找到有關它們在人體中作用的相關線索。這些工作非常重要,因為科學家們確信這98%中有些部分作為調節元件,指導了蛋白質何時何地,以多大量合成。這一工作對于了解正常細胞行為非常關鍵,然而科學家目前也僅僅了解少數個例。他們不知道是否存在比目前已知數量更多的調節元件,也不知道如果確實如此的話,它們又是如何發揮作用的。這些調節區域可能有助于解釋某些與遺傳相關,但是又與特定編碼基因無直接關聯的疾病的基礎。
在2012年9月,Encode項目的主要研究階段正式結束。研究者們發表了幾十篇同行評審的文章,其中發表在Nature雜志上的論文稱,人類基因組中80%的序列是具有功能的。同時研究者們還公開了數據庫,這個數據庫對大部分非編碼序列進行了注釋。注釋方式基本上就是這樣:“這部分序列與一種蛋白質結合”,“這部分序列常被甲基基團標記”,“這部分序列通常隱藏在組蛋白的包圍中”。
而對于Encode項目的批評大部分并不是針對其所構建的數據庫。牛津大學的遺傳學研究專家Chris Ponting說道,“Encode項目為科學界提供了大量有用的數據,這些數據正在用于的研究中。”但Chris Ponting并不贊同Encode項目有關功能性DNA的結論。實際上,主要的批評針對的是項目研究者在結論上的“大躍進”,尤其是他們公開發表稱人類基因組中大部分序列是人類生命所必需的。批評意見認為,Encode項目的工作并不能支持這樣的結論,向公眾傳達了不準確的有關遺傳與進化的觀念。
產生這些分歧的關鍵在于,Encode在DNA中發現了具有化學活性的部分,并稱其具有“功能”。但是,并非所有的這類活性都是人類生命所必需的。例如,Encode的科學家尋找與蛋白質結合的DNA區域,因為這類結合對于打開、閱讀以及標記DNA是必須的。但是有的DNA序列也可以結合蛋白質,但是卻與人類健康無關。在漫長的進化過程中,人類的基因組中吸納了許多來自病毒的DNA。那些不會危害或者協助宿主的DNA序列可能仍然包含有可與蛋白質結合的區域,或者發揮某些功能,但是并不影響細胞正常功能。
Encode項目不可避免地將一些可能對人體并無重要作用的區域當作活躍的功能區域。不過,Stamatoyannopoulos博士和其他的生物學家認為,Encode項目的80%的結論帶來了有關人類基因組的新視角。他說,人類基因組中如此高比例具有生物化學活性的事實說明,人類基因組中受到調控的序列比以前了解到的要多得多。甚至某些來自于病毒或者其他寄生生物的序列可能在人體中發揮有用的功能。西奈山醫學院的遺傳學家Eric Schadt (未參與該項目)說:“我認為這種調節網絡的復雜性將持續拓展我們的思維。我想我們會發現,基因組中的大多數序列在調節中發揮作用。”
批評意見強調,Encode項目并不是為了研究基因組中有多少非編碼序列在人類健康中發揮了重要作用。他們認為,Encode項目并沒有通過實驗證實那些新發現的“功能”區域如何對人體產生影響,因而獲得了多么新穎而具革命性的成果的這種說法是站不住腳的。
Encode項目的人士將人類基因組描述為其中大部分序列可被有效利用,但批評人士認為這不是正確的看待基因組的方式。“人類基因組是一臺的機器嗎?人類基因組是所有基因組中的嗎?或者它只是一團糟?搞清這些問題非常重要,”幫助設計Encode項目的遺傳學家Sean Eddy說。“我們對基因組的認識是,它確實是一團糟。”
對于“一團糟”,Eddy指的是從進化的數學模型得出的結論:基因組中至少有85%質90%的序列對人類健康不是必須的,即便它們具有化學活性。這么說的部分理由是,人類基因組在漫長歷史中積累了無數的突變,如果基因組中大多數序列是必須的,那么人類早就因為這些突變對健康的影響而滅絕了。另一方面,Stamatoyannopoulos博士和Schadt也表示,那些數學模型是基于1960年代的一些簡單方程而建立的,可能具有某些數值上的錯誤。Eddy說,那是有可能的,但是科學家在貶低這些模型前應該先找到更好的論據來駁倒它們