资讯中心

《大规模并行测序 测序数据的质量评估》征求意见

2023/4/24 9:32:37    22367
来源:仪表网
摘要:近日,国家标准计划《大规模并行测序 测序数据的质量评估》编制完成并征求意见,时间截止到2023年6月23日。主要起草单位为中国测试技术研究院等。
  【仪表网 行业标准】近日,国家标准计划《大规模并行测序 测序数据的质量评估》编制完成并征求意见,时间截止到2023年6月23日。主要起草单位为中国测试技术研究院等。
 
  测序技术应用广泛,一次测序得到大量数据,数据整理与分析是高通量测序应用于生物研究最关键的环节,若未按需求对数据进行分析与评估,则所测得数据无法验证实验结果。有效的数据分析与质量控制有利于物种鉴定、病原体识别、病毒基因溯源、医疗诊断、环境微生物检测、测序仪校准等需要,用于通过测序和序列比对分析来进行基因鉴定的行业/科研领域。
 
  大规模并行测序的数据质量评估是一项跨领域的分析手段,涉及生物信息学知识较多,广泛影响生物科技的许多方面。例如,在食品领域,即使没有参考样本或参考基因序列,通过对植物或动物产品中源性成分各目标基因进行测序,通过数据库序列信息比对即可确定源性,以进行物种真实性鉴定,实现对复杂背景样本和未知物种样本中各种源性成分信息的高通量检测,用于品牌维护及肉类掺假鉴定;对土壤、水体、空气中微生物及发酵产品、果蔬贮藏过程中微生物的多样性及功能分析;通过血清中肿瘤标志物的测定,协助肿瘤的诊断、预后判断及疗效评价;通过检测肿瘤患者特定的基因变异情况,协助实施针对靶点的精准治疗方案;基于reads 深度、双末端映射、拆分read、从头拼接等方法检测拷贝数变异,以探究人类多种疾病的成因。
 
  大规模并行测序技术由于其准确性和检测通量改变了整个检测领域的发展。一次高通量测序可以读取400 000-4 000 000条序列,不同的测序平台可读取到的碱基数不等,测序平台的不断进步与更新促进了测序方法/仪器的广泛发展,目前NGS 的主要代表平台有Illumina公司的Solexa基因组分析仪、华大基因的MGISEQ-2000平台及ABI的SOLiD测序仪,Solexa 聚合酶合成测序的关键技术是:“DNA簇”和“可逆性末端终结”,SOLiD连接酶测序取代了传统PCR,可对单拷贝DNA片段进行大规模扩增和高通量测序。
 
  然而,对测序所得的数据进行整理与分析仍面临巨大的挑战。首先,一次测序得到海量数据,对数据分析处理需采用大量软件及工具,要求试验人员熟练操作各项软件并具有生物信息学知识的储备;其次,测序过程中存在仪器报错的可能性,影响测序数据质量,加大数据分析难度;此外,核酸浓度及纯度未达到测序要求、选择不合适的文库制备方法会影响测序结果,导致检测效率低、准确性差。
 
  本标准的研制有利于提高测序数据的准确性及可信度、支持测序方法的选择和优化、提供可用于性能资质鉴定的关键性能参数。具有更高可信度的生物技术和生物学工业数据,能实现数据的共享,提升检测准确性,减少风险和成本,促进国际交流。
 
  本文件适用于测序数据的质量评估与验证。确定了原始数据的评估指标(序列长度分布、每个序列GC含量、质量值、序列重复水平、超出阈值水平、集群密度、出错率等)、分析用于不同应用的序列校正及比对软件;测序校正和比对的质量控制,包括单端测序片段比对,配对段测序片段比对,子片段的长度比对;变异识别,能识别SNV、插入缺失、CNV和SVs 四种变异类型,变异识别质量指标包括变异质量值、等位基因读取百分比、样品间污染分析等;质量指标验证,包括建立去除低质量碱基的方法、确定比对质量参数、定义平均覆盖范围;高通量测序方法特异性及灵敏度确认(单一物种验证、混合样品检测、不同加工方式样品检测)。
 

全部评论

上一篇:两项水生态监测评价标准由生态环境部正式批准发布

下一篇:《自动分检衡器校准规范》征求意见

相关新闻
热门视频
相关产品
写评论...