最xin血浆蛋白质组学图谱,揭示血浆蛋白质组、遗传学和疾病之间的关联
时间:2023-10-27 阅读:278
高通量蛋白质组学平台SomaLogic和Olink是两个基于亲和力的高通量蛋白质组学研究平台,它们通过对结合靶蛋白进行测量,在血浆蛋白等数千种蛋白质的测量方面具有重要作用,有助于理解基因组与疾病之间的关系。SomaLogic的平台使用单个适体来测量目标蛋白,而Olink的平台则需要结合两种不同抗体进行免疫分析,这两个平台在测量蛋白质方面具有一定的差异,也是近年来科学家们关注的重点问题。
近日,来自deCODE Genetics /安进公司和冰岛大学的Kari Stefansson团队在国际顶刊《Nature》上在线发表了题为“Large-scale plasma proteomics comparisons through genetics and disease associations”的研究性论文(图1)。
在这项研究中,他们比较了基于Olink Explore 3072平台和SomaScan v4平台的数据,分析了由英国生物银行(UKB)和冰岛生成的血浆样本数据,并使用可用基因型和表型数据来比较它们与平台上蛋白质水平的关联,发现选择不同的平台在疾病研究的背景下会对结果和结论产生实质性的影响。这项研究深入理解了SomaLogic和Olink平台在高通量蛋白质组学研究中发挥的重要作用,加深了对序列变异与疾病和其他性状之间关系的理解。
图1
通过对Olink Explore 3072中的1474个样本和SomaScan v4中的419个样本进行重复测量,研究人员发现,Olink平台的中位CV比低于SomaScan平台(分别为0.35和0.50),这表明Olink平台的测定更加jing确。这与之前的研究结果相反,之前的研究发现对照样品的SomaScan测定的CV值低于Olink测定的CV值。这表明对照样品的CV值并不一定反映测定的精度,而CV比率则更准确。
图2
根据SomaScan和Olink两个平台的研究结果,研究人员发现两个平台之间的水平相关性为0.33,分布呈现两种模式,一种略高于0,另一种略低于0.6(图2)。Olink平台由早期版本1536和附加后续检测集Expansion组成,其中1536组的中位数相关性显著高于扩展组,分别为0.36和0.27。相比之下,两个平台上所有可能检测到的中位数相关性为-0.01,Olink平台内的中位数相关性为0.08,SomaScan平台内的中位数相关性为-0.01。在两个平台上检测到的cis pQTLs分析中,蛋白质水平的总体方差更为一致,但单个平台上是否存在cis pQTLs没有显示出明显的趋势。
Olink和SomaScan平台在检测血浆蛋白质时,显示出不同稀释组间的蛋白质丰度和相关性差异,且大部分蛋白质水平低于检测限。两个平台都缺乏细胞内蛋白而富含分泌蛋白。组织之间的蛋白质水平相关性差异较大,且与测量精度相关。样本年龄、性别和BMI与许多蛋白质水平显著相关,且两个平台在某些疾病中蛋白质关联结果一致,但也有不一致的结果,这可能与不同平台间的测量差异和可能存在的不同蛋白质形态有关。
在pQTL分析中,研究人员使用更多序列变体和数据归一化方法,鉴定了大量顺式和反式pQTL。在Olink和SomaScan数据中,超过98%的顺式pQTL仅与一种蛋白质相关,但少数pQTL与多个蛋白质相关。研究人员还注意到在RNA水平上存在cis基因表达的共同调控,但不影响pQTL检测性能。他们还发现特定蛋白质的cis pQTL检测与高于LOD的测定分数和高于LOD的中位数归一化蛋白表达值呈正相关,但这并不意味着低于LOD的测量值不能提供信息。
研究人员还对不同祖先群体进行pQTL分析,评估了更大的序列多样性和LD的可变模式,将关联信号细化到更少的变体。他们分别使用Olink Explore 1536平台和SomaScan平台对非洲人血浆中的1472种蛋白质水平进行分析,并检测了顺式pQTL。发现不同祖先群体之间存在pQTL的差异,非洲血统的测试者中较为常见与低水平的低密度脂蛋白蛋固醇相关的PCSK9功能缺失变体,研究人员还发现了与血红蛋白β亚基编码基因HBB中的镰状细胞贫血变体相关的高水平HMOX1。UKB-AF组的顺式pQTL具有较高的LD和平均变异数较少,与非洲血统人群具有更高的序列多样性和较低的LD相一致(图3)。在共有的893个蛋白中,有62个蛋白在UKB-AF中实现了顺式pQTL位点的大量改进,暗示在非洲血统人群中研究与相同变体的疾病相关性可能会获得潜在收益。这些结果表明不同祖先群体之间存在pQTL的差异,并对疾病相关性研究具有潜在价值。
图3
研究人员还发现Olink和SomaScan两个平台检测到的蛋白质数量相差不大,且大部分蛋白质都有cis pQTL存在。然而,两个平台检测到的pQTL主要是trans pQTL,且反式的pQTL关联多于顺式,但顺式的次要关联多于反式。他们探讨了顺式pQTL的检测比例受多种因素影响,包括稀释组、亚细胞位置和CV比。此外,蛋白质的丰富程度和检测精度也会影响顺式pQTL的检测比例。在分析仪器匹配的蛋白质方面,Olink平台比SomaScan平台的独联体pQTL检测比例更高,而Olink和SomaScan平台之间的相关性也较高(r = 0.48),但低于cis pQTL的相关性(r = 0.17)。最后,研究人员通过全基因组测序的数据,发现了与罕见序列变异相关的蛋白质水平在两个平台上的差异。
研究人员深入探索了Olink和SomaScan两个平台检测的pQTL之间的关联性和差异。他们发现虽然两个平台对pav引起的表位效应同样敏感,但当一个平台的pQTL在另一个平台没有找到相应的pQTL时,或者两个平台的pQTL处于高LD时,它们之间的相关性较低。此外,研究人员还指出了即使在两个平台上都检测到一种蛋白质的pQTL,也不能轻易地认为它们wan全相同,因为它们可能受到不同的技术、样本、数据质量等因素的影响。此外,一些在SomaScan数据中与多个蛋白质相关的pQTL在Olink数据中并不与任何蛋白质相关,反之亦然。尽管两个平台上都检测到了多效性pQTL,但它们并不玩全相同。总的来说,尽管在两个平台上都检测到多种蛋白质的pQTL,但它们之间的关联性和差异需要谨慎地考虑。
因此,研究使用了三种方法来建立这种关系:一种是分析pQTL和疾病相关变异之间的高LD(连锁不平衡),另一种是将疾病相关变异包含在具有pQTL的高LD的可信基因集合中,蕞后一种是对于具有必要统计数据的特定示例,进行统计共定位分析。在Olink-UKB-BI和冰岛的SomaScan两个数据集中,都分别检测到了大量的顺式和反式pQTL,并且一些疾病相关的变异被发现在可信基因集合中。此外,研究人员还发现了一些具有疾病相关变异的高LD的顺式pQTL,例如在IL10位点,rs3024493的次要等位基因(A)与其相关的rs3024505与IBD34的风险增加相关(图4)。这个变异与较低的IL-10水平相关,而IL-10被认为是该区域蕞有可能的候选基因。总的来说,这些研究结果有助于更好地理解疾病相关变异与蛋白质水平变化之间的联系,以及这种联系可以更好的预测疾病风险。
图4
此外,研究人员还对肿瘤坏死因子配体超家族成员11 (TNFSF11)、ERBB4、GRP和IL2RB的顺式pQTL与一些疾病相关性进行了研究。这些变异与原发性胆汁性肝硬化、较低的BMI和2型糖尿病风险、哮喘风险等有关。此外,他们还讨论了在两个平台上检测到的顺式pQTL与疾病相关变异高LD的情况,并解释了反式pQTL与疾病关联的可能机制。
研究人员还发现反式pQTL通常与受疾病影响的组织中表达丰富的蛋白质相关,这些发现可能指向潜在的疾病生物标志物。例如,DEFB4A和PRSS2的水平在两个平台之间高度相关,而且在两个平台上都观察到cis pQTL。为了评估哪些与疾病相关的反式pQTL可能对应于同一途径中蛋白质之间的相互作用,他们根据STRING数据库评估了受反式pQTL影响的每个蛋白质是否与zui接近变体的基因编码的蛋白质相互作用。对于具有疾病或性状相关变异的高LD中约9%的反式pQTL,已知这两种蛋白之间高度相互作用。例如,TLR3的变异与自身免疫性甲状腺疾病和IFNL1的反式水平相关,带有IFNL1的反式pQTL强烈支持TLR3在自身免疫性甲状腺疾病发病机制中的变异位点的作用。因此,这项研究的结果支持通过反式pQTL来研究潜在的疾病生物标志物和药物靶点,以帮助更好地了解和治疗疾病。
总结
这项研究通过比较了Olink Explore 3072和SomaScan v4平台的数据,研究人员发现两个平台之间存在适度的相关性。尽管两个平台上检测到的顺式蛋白数量性状位点的决对数量相似,但Olink平台在此类分析性能支持证据的比例上更高。此外,许多蛋白质在不同平台之间具有基因组关联。因此,选择合适的平台对于蛋白质与疾病研究的结果和结论具有重要影响。这些平台提供的信息具有互补性,有助于研究人员更好地理解蛋白质与疾病之间的关系。
以上文章来源于Being科学 ,作者鸢尾与半夏