转载 | 沈侠团队揭示大脑基因异构体比例的遗传效应
发布日期:2023-05-31 16:06:10 作者: 来源:
浏览次数:3425
近日,《表型组学》(Phenomics)期刊在线发表了复旦大学生命科学学院、遗传工程国家重点实验室、粤港澳大湾区精准医学研究院(广州)沈侠研究员团队题为“Hidden Genetic Regulation of Human Complex Traits via Brain Isoforms”的封面文章。这项国际合作研究鉴定了影响大脑基因异构体比例的基因位点,并揭示了这些异构体表达的遗传调控机制以及它们与多种神经相关表型的因果关系,为我们提供了“大脑如何影响精神疾病和人类行为等神经相关表型”的新视角。
扫二维码|查看原文
论文DOI链接:
https://link.springer.com/article/10.1007/s43657-023-00100-6
论文pdf链接:
https://link.springer.com/content/pdf/10.1007/s43657-023-00100-6.pdf?pdf=button
引用格式:
Pan, L., Zheng, C., Yang, Z. et al. Hidden Genetic Regulation of Human Complex Traits via Brain Isoforms. Phenomics (2023). https://doi.org/10.1007/s43657-023-00100-6
一、研究背景
当今的遗传学研究已经发现了许多基因与人类性状和复杂疾病之间的关系。尽管我们对基因有了更深入的了解,但我们仍然只知道有限的信息。特别是在神经学和脑科学领域,我们对基因和大脑是如何影响我们的行为和认知方面的了解仍然非常有限。此外,选择性剪接是大多数多外显子基因在转录中会发生的一个过程,它会让同一基因通过不同的基因异构体(isoform)产生各种不同形式的蛋白质产物。以往的研究往往只关注总体的基因表达,忽视了同一基因表达水平可能会对应着不同的基因异构体表达比例。异构体表达的不同水平可能会导致特定基因的不同功能和不同的下游表型的表现形式。因此,异构体表达是理解复杂性状和疾病遗传调控的关键因素。
二、研究结果
本文作者获取了基因型-组织表达联盟(Genotype-Tissue Expression Consortium, GTEx Consortium)收集的来自13个不同大脑区域, 1,191 个样本中的RNA表达数据。他们使用了团队开发的异构体表达估计方法XAEM,估计了超过8,000个编码蛋白质基因的异构体表达比例。作者对每个基因的异构体比例进行了全基因组关联分析(Genome-wide association study, GWAS),并鉴定了异构体比例的数量性状位点 (isoform-ratio quantitative trait loci, irQTL),这些位点是仅通过总体基因表达数据无法检测到的。
该研究发现了7,099个cis-irQTL(P < 5×10−8)中的4,241个irQTL在基因总体表达水平上没有表现出基因表达量数量性状位点(expression quantitative trait loci, eQTL)的效应(PeQTL > 0.05)。对于这些irQTL,其对应的基因在大脑组织中具有相对稳定的表达水平,但其异构体比例受到irQTL的遗传调节。作者在后续分析中着重研究了这4,241个irQTL。
作者进而用S-LDSC方法在各个脑组织中进行了114种神经相关表型的遗传力富集分析,并估计irQTL注释的基因组区域的遗传力,然后将其与其他蛋白质编码基因所注释的区域比较,以确定是否存在富集。在假阳性率(False Discovery Rate, FDR)低于5%的情况下,他们发现三个大脑组织通过基因内异构体比例的遗传调控与13个神经相关表型显著关联。例如,额叶皮质BA9的基因异构体表达比例与老年痴呆、情绪波动、紧张感、情绪敏感、睡眠时间、酒精摄入和避孕药物摄入相关。
此外,作者使用了孟德尔随机化(Mendelian Randomization, MR)的方法来探究不同基因里蛋白质异构体比例与114个神经相关表型的因果关系,共发现了1,092对基因异构体与性状之间存在从基因异构体对神经相关表型的因果效应(FDR < 5%)。以MMAB基因为例子,其cis-irQTL在多个组织中均有被发现,它的两个基因异构体的比例与睡眠时间、失眠、神经质、感到悲惨和精神分裂症这些神经相关表型具有因果关系。此外,本文作者也对来自UK Biobank(UKB)的200个疾病构建了类似的因果分析。由于200种UKB疾病中的大多数与神经无关,与这些疾病相比,神经相关表型发现的因果关联信号相对更强。而反向的因果推断分析并没有揭示复杂性状对异构体的表达比例具有统计学上显著的影响。
irQTL结果汇总及示例
三、研究结论
该研究对大脑中特定的irQTL——控制基因的异构体表达相对比例而不是整体基因表达水平的数量性状位点进行了一系列研究。除了识别出数千个无 eQTL效应的 irQTL 外,作者还发现具有此类irQTL调控特性的基因富集某些人类复杂性状的遗传力,尤其对于神经相关表型。通过孟德尔随机化分析,该研究衡量了受遗传调控的异构体比例对人类神经相关表型的下游因果效应。研究强调了量化和研究异构体表达对于探索人类复杂性状与疾病遗传机制的重要性。
复旦大学生命科学学院、遗传工程国家重点实验室、粤港澳大湾区精准医学研究院(广州)沈侠研究员为本文通讯作者,博士生潘璐、郑晨晴、杨志键为共同第一作者。该项目受到国家自然科学基金(No.12171495),广东省自然科学基金(No.2021A1515010866),国家重点研发计划(No.2022YFF1202105),以及瑞典研究理事会(No.2017-02543和No.2022-01309)的资助。
Abstract
Alternative splicing exists in most multi-exonic genes, and exploring these complex alternative splicing events and their resultant isoform expressions is essential. However, it has become conventional that RNA sequencing results have often been summarized into gene-level expression counts mainly due to the multiple ambiguous mapping of reads at highly similar regions. Transcript-level quantification and interpretation are often overlooked, and biological interpretations are often deduced based on combined transcript information at the gene level. Here, for the most variable tissue of alternative splicing, the brain, we estimate isoform expressions in 1,191 samples collected by the Genotype-Tissue Expression (GTEx) Consortium using a powerful method that we previously developed. We perform genome-wide association scans on the isoform ratios per gene and identify isoform-ratio quantitative trait loci (irQTL), which could not be detected by studying gene-level expressions alone. By analyzing the genetic architecture of the irQTL, we show that isoform ratios regulate educational attainment via multiple tissues including the frontal cortex (BA9), cortex, cervical spinal cord, and hippocampus. These tissues are also associated with different neuro-related traits, including Alzheimer's or dementia, mood swings, sleep duration, alcohol intake, intelligence, anxiety or depression, etc. Mendelian randomization (MR) analysis revealed 1,139 pairs of isoforms and neuro-related traits with plausible causal relationships, showing much stronger causal effects than on general diseases measured in the UK Biobank (UKB). Our results highlight essential transcript-level biomarkers in the human brain for neuro-related complex traits and diseases, which could be missed by merely investigating overall gene expressions.
沈侠教授、博士生导师,国家高层次青年引进人才,复旦大学生命科学学院、遗传工程国家重点实验室、粤港澳大湾区精准医学研究院(广州)研究员,爱丁堡大学(University of Edinburgh)荣誉研究员;致力于统计遗传学方法的创新研究与多组学大数据分析,研究领域涉及数理统计、计算科学、生命科学等多学科交叉融合;回国前曾任英国爱丁堡大学与瑞典卡罗琳斯卡医学院(Karolinska Institutet)两所国际知名院校统计遗传学助理教授、博士生导师;2018年至2021年曾任中山大学生命科学学院教授、博士生导师;在国际学术期刊共发表论文60余篇,其中代表性研究成果发表于Nature Genetics、Nature Communications、Circulation、American Journal of Human Genetics等国际知名期刊。
粤港澳大湾区精准医学研究院
GREATER BAY AREA INSTITUTE OF PRECISION MEDICINE
版权所有© 粤港澳大湾区精准医学研究院 粤ICP备2021038868号 粤公网安备 44011502000710号