使用dbSNP和ClinVar数据库分类基因变异体

上篇文章主要介绍了研究和分类基因变异的重要性,对基因变异进行分类的困难,以及如何使用Ensemble数据库对基因变异进行分类。本文继续介绍两种数据库的使用,dbSNP和ClinVar数据库,当你在Ensemble了解了更多目的基因的信息,可以去dbSNP数据库进行进一步的搜索查询。

 

一、dbSNP ---单核苷酸多态性的数据库

 

dbSNP是由NCBI提供的,在这个数据库,可以查看是否有人已经发现了你的变体。dbSNP不仅包含SNPs(单核苷酸多态性),还有很多其他的变异,如短删除、插入和多核苷酸多态性。dbSNP中的数据有两种主要类型:由用户提交,可以通过“提交的SNP”(ss)标识符来识别;由多个提交的数据和来自其他来源的数据组合而成的数据,可以通过“reference SNP” (rs)标识符识别。

 

dbSNP数据库

 

如上图所示,dbSNP提供了关于变异体的大量信息,将显示任何可用的rs。以BRCA2为例,dbSNP不仅给出了一些基本信息,例如命名法、有机体或分子类型,而且它还列出了PubMed中关于该变体的引用,并提供了指向所有引用文章的直接链接。在中间的列中,可以找到更多的分类信息,比如MAF/Minor Allele Count, MAF是一个等位基因在人群中发生的频率。在第三栏中,会发现人类基因组变异学会(HGVS)的名字,根据不同的术语来识别你正在研究的基因。

 

  1. 解释Minor Allele Count

 

编码非功能性蛋白的等位基因通常不会在人群中频繁发生,仅仅是因为它们没有益处,或者是致病的。因此,它们在基因库中的存在是非常低的,我们也不会估计其MAF是高的。例如,如果一个等位基因发生在人群中的MAF为10%,这意味着相当数量的个体携带这种等位基因,并且不太可能导致疾病。然而,当我们看MAFs时,必须小心谨慎,我们必须知道正在搜索的表现型的遗传模式。每个特征都有两个等位基因,除了性染色体。

 

  1. 关于表型遗传

 

常染色体显性遗传模式:变异位于常染色体,一个等位基因足以使疾病显现。这种类型的疾病通常在每一代都有表现,例如亨廷顿氏病,神经纤维瘤病1型。

 

常染色体隐性遗传模式:变异在常染色体,两个致病等位基因是疾病显现必需的。这意味着这种疾病可能会“跳跃”好几代。例如,囊性纤维化,白化病。

 

伴X或伴Y染色体的遗传模式: 变异在一个性染色体上,与X相关的疾病可能对男性和女性都有影响,但与Y有关的疾病只会影响男性。

 

如果疾病遵循隐性遗传的模式,致病的等位基因可能隐藏在健康的表型中。由于只携带一个等位基因不会导致疾病,这样的等位基因可以“自然选择躲避”,因此,可能会有比我们预期的更高的MAF。而且,某些致病的等位基因在某些条件下可能是有益的。例如,对于导致镰状细胞贫血的变种来说,在疟疾流行的地方,杂合是非常有用的。因此,在这些地方,镰状细胞相关等位基因的MAF可能更高。所以,你必须知道你在寻找什么,学习如何准确地阅读一个MAF,并从中得出一些结论。

 

二、ClinVar数据库

 

ClinVar,也来自NCBI,是可以自由访问的,它显示了基因型和表型之间的关系,并提供了支持证据。在ClinVar中,变异与可能的表型和临床意义有关。临床意义包括:良性,可能良性,VUS(未知的变异),可能致病性和致病性。每一个分类都由提交者注册,每一个提交都经过自动检查和人工管理的审查和验证。ClinVar有一种专门的系统进行评估,以星级形式显示在review status处。

 

ClinVar数据库

 

你会发现有的分类只有一颗星,这并不一定意味着它们是错的,这种变异和临床意义之间的特殊联系并没有被多次提交。例如,下图所示的变体只有一颗星,但它仍有可能是致病性的。这种变异,在BRCA2基因中,确实是致病性的,因为它使整个蛋白质无效。这种基因的突变会导致对各种类型的癌症的易感性,比如乳腺癌。这种突变,在葡萄牙人群是一种基础突变,意味着这个种群的一个或多个祖先是这种突变的载体,在葡萄牙人口中有很高的频率。

 

ClinVar数据库

 

 

在ClinVar中,可以很容易地看到变体的命名,以及提交的星数。进一步查看页面,可以看到变体相关的任何条件,以及与MedGen和OMIM的直接链接,以进一步了解这些。MedGen和OMIM是包含遗传紊乱信息的数据库,是学习更多关于遗传模式、表型特征和与特定疾病相关突变的极好的资源。

 

向下滚动到页面的底部,会发现“Assertion and evidence details”页面,这可能是最重要的信息。包含三个主要类别:Clinical assertions, Summary evidence and Supporting evidence,是由提交者完成的,包含了提交者用来选择特定临床意义的所有信息,会让你对变体有更多的了解。

 

lamin b1tel

艾美捷科技优势代理品牌

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: