您現在的位置是:首頁 > 影視首頁影視

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

由 中國生物技術網 發表于 影視2023-01-18
簡介南北方漢族測試資料集的基因型推演錯誤率綜上,基於中國人群的大型佇列深度 WGS 資料,研究團隊構建了中國人群的遺傳變異圖譜和首個數千人級別公開可用的中國人群單倍型參考面板,將所有結果整合為中國人群基因組資源庫NyuWa(圖6),旨在促進中國

什麼是遺傳和變異?兩者本質是什麼

遺傳變異圖譜是研究人群演化史、醫學遺傳學、基因型-表型關聯的基礎。此前,大多數全基因組測序相關研究主要集中在歐洲血統人群。已有研究表明,罕見和低頻的變異往往是特定於人群或樣本的,尤其是許多與疾病相關的變異。針對特定人群的基因組資料可以為全基因組關聯研究、區域適應性研究、用藥指導等提供更準確的參考。

單倍型參考面板可基於大型人群佇列中已知的單倍型資訊,對來源於相對稀疏的基因變異晶片或低覆蓋率測序的樣本中缺失的基因型進行推演,是促進全基因組關聯研究 (

genome-wide associationstudy, GWAS

) 的有意義且具有成本效益的方法。此前缺乏中國人群特異的參考面板,其他參考面板對中國人群特異的變異推演效果較差,從而導致

GWAS

中遺漏潛在的表型相關變異。

中國人群全基因組測序資源和單倍型參考面板的缺乏極大地阻礙了世界上最大人群的遺傳學與精準醫學研究。為此,中國科學院生物物理研究所徐濤院士團隊和何順民研究員團隊合作在國際學術期刊《

Cell Reports

線上發表了題為

NyuWa Genome Resource: A Deep Whole Genome Sequencing-Based Variation Profile and Reference Panel for the Chinese Population

的文章(圖

1

),

介紹該團隊關於“女媧”(NyuWa)中國人群基因組資源庫(

http://bigdata.ibp.ac.cn/NyuWa/

)的工作,提供針對中國人群的遺傳變異圖譜與參考面板基因型推演服務,旨在促進中國人群的遺傳學與醫學研究

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

1。

文章發表於

CellReports

研究團隊分析了 2,999 箇中國人的全基因組深度測序資料(26。2X),並以中國神話中創造人類的女媧命名。基於NyuWa資料資源,構建了包含7106萬SNPs 和819萬 InDels的中國人群遺傳變異圖譜(圖2),並對其進行全面註釋。相比其它人群佇列,NyuWa資料集包含2501萬新的變異,其中包括14。9萬非同義變異、10。1萬有害變異、11493個編碼和非編碼基因的功能喪失變異、636個癌症相關基因的蛋白截短變異。大量的新變異表明,在以往的遺傳研究中,中國人群的變異代表性不足,NyuWa基因組資源則填補了這一空缺。

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

2。 NyuWa

全基因組測序資源的變異數量

此外根據臨床相關資料庫的註釋,在

NyuWa

中發現了

1,140

個致病變異,以及藥物基因組學相關位點(圖

3A

)和癌症風險位點(圖

3B

)上中國人群與世界其他人群的變異頻率差異。這些發現有助於中國人群精準醫學研究,可能促進新的遺傳學和醫學進展。

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

3。 NyuWa

中的藥物基因組學位點(

A

)與癌症風險基因座(

B

)變異

漢族人口是東亞乃至全世界最大的民族,約佔全球人口的 20%,為漢族人群構建一個完整的、大佇列的、高質量的參考面板,對漢族的遺傳學與醫學研究具有重要參考價值。基於NyuWa資料資源,研究團隊構建了包含 5804 個單倍型和 1926萬 變異的單倍型參考面板,其中325萬變異未包含在其它參考面板中,這些 NyuWa 參考面板特有的變異可能會在未來的關聯研究中帶來新的發現。這是第一個數千人級別公開可用的中國人群特異的單倍型參考面板。

為了評估NyuWa參考面板的基因型推演效能,研究團隊使用來自人類基因組多樣性計劃(the Human Genome Diversity Project, HGDP)的亞洲各個人群晶片基因分型資料和高覆蓋率 WGS 資料作為測試資料集。與其他參考面板相比,NyuWa 參考面板將漢族人群基因型推演的錯誤率降低了 30%–51%,在大多數其他東亞和東北亞人群中也有優異的表現(圖4A-D)。研究團隊進一步比較了不同等位基因頻率的推算結果和實際基因型之間的相關性,NyuWa參考面板的效能在漢族的所有等位基因頻率區間中均具有絕對優勢(圖4E)。此外,NyuWa參考面板與千人基因組(1KGP3)面板的結合進一步提高了亞洲人群的基因型推演效果。

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

4。 NyuWa

參考面板對漢族基因型推演具有最佳效能

考慮到南北方漢族遺傳差異的存在,研究團隊將 NyuWa 參考面板中的樣本分為北方和南方子集,使用子集樣本分別構建北方和南方漢族的參考面板,透過基因型推演的模擬測試,證明以NyuWa的人群規模,一個南北整合的參考面板對中國北方人和南方人都適用(圖5)。

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

5。

南北方漢族測試資料集的基因型推演錯誤率

綜上,基於中國人群的大型佇列深度 WGS 資料,研究團隊構建了中國人群的遺傳變異圖譜和首個數千人級別公開可用的中國人群單倍型參考面板,將所有結果整合為中國人群基因組資源庫NyuWa(圖6),旨在促進中國和亞洲人群的遺傳學和精準醫學研究。

“女媧”基因組資源釋出!提供中國人群遺傳變異圖譜和參考面板

6。 NyuWa

資源庫

當前有關醫學基因組學的知識和指南主要來自以歐洲人群為主的遺傳和基因組資源,可能會遺漏有關非歐洲人群的遺傳資訊。亞洲人群起源、遷徙和融合歷史悠久而複雜,使得其遺傳多樣性研究充滿了挑戰和機遇。作為世界上人口最多的國家,針對中國人群的全基因組測序工作,對於擴充世界人群遺傳資源多樣性、提高中國人群醫學研究準確性非常必要,有助於深入瞭解亞洲人群結構與人群歷史,並對尋找複雜疾病遺傳因素的研究設計以及人口健康指導具有重要參考價值。

中國科學院生物物理研究所的

何順民

研究員、

徐濤

院士為該文共同通訊作者,中國科學院生物物理研究所的副研究員張鵬博士、副研究員羅華夏博士、特別研究助理李燕燕博士、副研究員王友博士、博士研究生王佳佳、博士研究生鄭宇為該文並列第一作者。本研究得到了中國科學院戰略性先導科技專項、國家自然科學基金、國家重點研發計劃、中國科學院資訊化專項、國家基因組科學資料中心的支援。

參考資料:

Zhang et al。, NyuWa Genomeresource: A deep whole-genome sequencing-based variation profile and referencepanel for the Chinese population,

Cell Reports

(2021), https://doi。org/10。1016/j。celrep。2021。110017