人類近期的適應(yīng)
現(xiàn)代人類大約在20萬年前出現(xiàn)于非洲,然后在8萬年前到5萬年前迅速遷移到世界各地。因此,這就要求我們的祖先要面臨各種各樣新的選擇壓力,如:適應(yīng)其他地區(qū)相較于非洲的“寒冷溫度”,新的飲食習(xí)慣和高原地區(qū)的缺氧適應(yīng)等等。識(shí)別人類適應(yīng)這些選擇壓力的遺傳性狀是非常重要的。
全基因組單核苷酸多態(tài)性的方法(SNP)和來自全球人類全基因組測序的數(shù)據(jù)(WGS)可以識(shí)別新的候選適應(yīng)性基因和基因介導(dǎo)的途徑,用于研究全球不同人群的適應(yīng)能力。識(shí)別候選適應(yīng)性基因最大的困難是:產(chǎn)生基因組突變的進(jìn)化過程在基因座之間是可變的,而且基因組在進(jìn)化過程中的變異位點(diǎn)不一定會(huì)參與蛋白質(zhì)的編碼,這些位點(diǎn)可以位于編碼基因之間的區(qū)域,這些區(qū)域可以調(diào)控編碼基因的表達(dá),有的變異位點(diǎn)甚至在受它們調(diào)控的基因的數(shù)千個(gè)堿基對之外。
這篇綜述,描述了全基因組中性位點(diǎn)檢測的現(xiàn)狀,基因組中含有最強(qiáng)適應(yīng)性性狀的區(qū)域,以及研究這些候選適應(yīng)性位點(diǎn)上變異的功能序列的整合方法。特別是,強(qiáng)調(diào)了最近確定的候選適應(yīng)基因和基因介導(dǎo)的途徑的例子,其中一些已經(jīng)在地理上不同的人群中進(jìn)行了研究。此外,還討論了利用表型、基因調(diào)控和功能數(shù)據(jù)解釋全基因組適應(yīng)性清掃的結(jié)果,以及該研究領(lǐng)域面臨的一些挑戰(zhàn)。
一、數(shù)據(jù)的獲取
在過去幾十年的研究中,從來自全球人類的全基因組數(shù)據(jù)里采集了幾組常見的SNPs,這些SNPs里揭示了人類的一部分適應(yīng)性性狀。SSNP陣列因?yàn)槠鋬r(jià)格便宜成為全球最大的數(shù)據(jù)集,但是大多數(shù)功能變異沒有被這些陣列捕獲,因?yàn)榈任换蝾l率和連鎖不平衡(LD)模式都受到確認(rèn)偏差的影響。因此,大多數(shù)關(guān)于正選擇的遺傳性狀的研究都集中在由常見SNP標(biāo)記或代表的候選基因或基因組區(qū)域上。
來自全球人口的WGS數(shù)據(jù)可以消除識(shí)別變異性狀的過程中所帶來的偏差,以及直接捕獲罕見的功能性變異。
二、變異的識(shí)別方法
在全基因組數(shù)據(jù)中識(shí)別正選擇性狀的最常見方法是使用對適應(yīng)性遺傳性狀敏感的統(tǒng)計(jì)檢驗(yàn),識(shí)別 “異常的” 突變。為此策略開發(fā)的統(tǒng)計(jì)方法主要用于識(shí)別經(jīng)典的選擇性清掃(我對經(jīng)典的選擇性清掃的理解是:當(dāng)選擇壓力存在并確定時(shí),在此選擇壓力下,一個(gè)新的有利突變在種群中的頻率會(huì)迅速上升,然后接近一個(gè)固定值),具體操作如下:
操作一:基于等位基因頻率的中性檢驗(yàn)
操作二:基于異常的LD模式的檢驗(yàn)
操作三:基于種群結(jié)構(gòu)(由種群里等位基因頻率的差異來衡量)的檢驗(yàn)
操作四:擴(kuò)展遠(yuǎn)距單倍型,以區(qū)分趨同進(jìn)化和單一適應(yīng)性突變的起點(diǎn),它對單一適應(yīng)性突變很敏感。
但是這些方法都存在一些不足之處,這是因?yàn)槿祟惖娜蚪M數(shù)據(jù)是分階段獲取的,再加上不同的估算方法會(huì)使最后的結(jié)果產(chǎn)生偏差。
另外,在近代人類快速遷移出非洲之前,很多突變就已經(jīng)存在人類的基因組里了,而從常態(tài)突變中進(jìn)行的選擇會(huì)留下比經(jīng)典清掃更難檢測的選擇性狀。當(dāng)適應(yīng)性性狀受多個(gè)基因座影響時(shí),此類信號(hào)甚至更難以檢測。新的統(tǒng)計(jì)方法可以利用WGS數(shù)據(jù)中等位基因頻率和單倍型模式的多樣性捕捉原本是中性的突變,因?yàn)槿巳航Y(jié)構(gòu)對常態(tài)突變特別敏感。
傳統(tǒng)的離散型統(tǒng)計(jì)一次評(píng)估一個(gè)突變,而現(xiàn)在的研究也在關(guān)注由多基因確定的性狀以及與特定表型相關(guān)的基因介導(dǎo)的途徑,因?yàn)樯矬w的表型會(huì)影響其自身的繁衍。生物途徑的注釋是一個(gè)復(fù)雜的問題,這需要更好的注釋基因的功能和更強(qiáng)大的統(tǒng)計(jì)方法。
三、結(jié)合人口統(tǒng)計(jì)學(xué)
理論上來說,使用全基因組數(shù)據(jù)研究適應(yīng)性可以用全基因組的變異模式來模擬人類種群結(jié)構(gòu)的形成過程,還可以研究非編碼區(qū)的變異,以尋找候選適應(yīng)性突變。但是缺乏真實(shí)的人口統(tǒng)計(jì)學(xué)模型來預(yù)測中性突變的模式會(huì)有很高的概率產(chǎn)生假陽性的結(jié)果。研究不同的適應(yīng)性性狀也需要結(jié)合在不同地域生活的人群。
四、容易實(shí)現(xiàn)的目標(biāo)
早期的全基因組研究發(fā)現(xiàn)人類一些具有重要影響的基因中,有幾個(gè)強(qiáng)大的適應(yīng)性性狀,說明了基因突變與表型變異之間,以及表型變異與生殖能力之間存在明確的關(guān)系,表明基因在適應(yīng)過程中的作用。例如,隨著人類飲食結(jié)構(gòu)的改變,以及畜牧業(yè)的發(fā)展,歐洲人相較于非洲人代謝乳糖的能力要強(qiáng)得多。容易實(shí)現(xiàn)的目標(biāo)包括:與生殖能力有關(guān)的表型以及少數(shù)的遺傳變異(每個(gè)變異對群體的遺傳結(jié)構(gòu)都有很大影響)。
五、復(fù)雜性狀
具有復(fù)雜遺傳結(jié)構(gòu)的性狀以及對個(gè)體生存、繁衍影響不明顯的性狀很難用離散型統(tǒng)計(jì)法去研究。對于這些性狀的研究,常用的方法是將全基因組SNP數(shù)據(jù)與表型數(shù)據(jù)相結(jié)合去定位變異基因的位置。但是與表型相關(guān)的SNPs在一個(gè)人群中被發(fā)現(xiàn)時(shí),將這些結(jié)果應(yīng)用于其他人群時(shí)要謹(jǐn)慎,因?yàn)長D的模式可能不同,性狀的遺傳結(jié)構(gòu)也可能不同。
六、從不同人群中的到的啟示
盡管研究不同的人群是一個(gè)很大的挑戰(zhàn),但是對于在相似環(huán)境中生活的不同人群,適應(yīng)性的生理途徑還是會(huì)有區(qū)別。例如,生活在高原地區(qū)的人,他們的低氧誘導(dǎo)因子1作用的途徑會(huì)縮短,這是趨同適應(yīng),但是不同的人群,途徑具體的縮短方式存在差異
開發(fā)新的方法來檢測多基因適應(yīng)以及正向選擇的常態(tài)突變對于研究趨同適應(yīng)非常重要。此外,適應(yīng)性的信號(hào)在種群內(nèi)部的不同群體以及種群之間存在的頻率不同,若確定各種群之間的親緣關(guān)系,追溯并確定祖先種群,可以確定種群在分裂后產(chǎn)生的適應(yīng)性性狀。
由于對局部環(huán)境的適應(yīng),原本只在特定人群中出現(xiàn)的適應(yīng)性性狀也有著可能出現(xiàn)在其他的人群中,因此將不同的人群納入基因組的研究非常重要,這或許可以闡明基因型與表型之間的關(guān)系。
七、表型和功能數(shù)據(jù)的使用
重現(xiàn)人類適應(yīng)性的生物學(xué)信號(hào),可以采用下述的方法:將全基因組清掃獲得的正向選擇與基因型-表型關(guān)聯(lián)研究,或?qū)Ⅲw內(nèi)、體外的基因組調(diào)控?cái)?shù)據(jù)和功能數(shù)據(jù)相結(jié)合,可以改進(jìn)對候選適應(yīng)性基因的識(shí)別。但是在不確定過去的選擇壓力或直接證明表型對種群的生殖影響之前,不應(yīng)排除一個(gè)基因座具有適應(yīng)性的可能。
八、數(shù)據(jù)集的整合
將適應(yīng)性的全基因組清掃與特定適應(yīng)性假設(shè)相關(guān)的表型數(shù)據(jù)相結(jié)合(候選適應(yīng)性基因 表型)有一個(gè)潛在的限制:許多生活與適應(yīng)性假設(shè)相關(guān)的、生活在不同環(huán)境條件下的人群很難被納入研究,這需要研究具有足夠的樣本量。上述生活在高原地區(qū)的人群,以不同的生理途徑適應(yīng)低氧的環(huán)境就是一個(gè)很好的例子。
很多研究都在將候選適應(yīng)性區(qū)域與基因組調(diào)控的變異整合到一起,使用全基因組數(shù)量性狀位點(diǎn)的表達(dá)調(diào)控來驗(yàn)證驗(yàn)證一個(gè)假說:與基因表達(dá)有關(guān)的遺傳變異在人類近期的適應(yīng)中是否起著重要作用。整合局部候選適應(yīng)性的基因座與推測基因調(diào)控途徑的變異改進(jìn)了一次只研究一個(gè)基因座的方法,現(xiàn)在可以將一組基因與另一組表達(dá)量協(xié)同上調(diào)或協(xié)同下調(diào)的基因一起納入研究。
事實(shí)上,基因調(diào)控途徑的變異很多還不清楚,在研究這些變異的功能前,弄清楚它們對表型和種群延續(xù)的影響非常重要。
九、后續(xù)的功能研究
體外實(shí)驗(yàn):將候選適應(yīng)性基因?qū)胗筛杉?xì)胞誘導(dǎo)產(chǎn)生的不同類型的細(xì)胞
體內(nèi)試驗(yàn):將基因?qū)缧∈篌w內(nèi),觀察與野生型小鼠相比,轉(zhuǎn)基因小鼠的變化
與人體相比,這些候選適應(yīng)性基因在體外實(shí)驗(yàn)和體內(nèi)模型體系中的表現(xiàn)可能會(huì)有不同,特別是限定變異的影響于特定的組織和/或發(fā)育時(shí)間
十、整合基因組學(xué)