lncRNA命名方式详解!

长链非编码RNA(long non-coding RNA,lncRNA)是指长度大于200 个核苷酸的不参与蛋白质编码过程的DNA 转录产物。而lncRNA命名对于做过microRNA研究的的小伙伴来说,对于lncRNA的命名会经常疑惑,特别是对于拿到高通量数据的小伙伴来说,经常会问,为什么我的lncRNA是RP11-252P19.1,ENST00000412680,NR_028388,BC039327这种,而别人的就是MALAT1,HOTAIR等高大上的feel呢?这就是lncRNA的命名所导致的。

 

 

lncRNA

 

实际上,lncRNA的命名还没有统一的原则,就跟lncRNA的功能一样,没有定法,因此我们这一季选择lncRNA这一角度来从不同的层面阐述分子机制研究的研究方法:表达、活性和定位。功能的复杂性使得我们能从不同的角度对lncRNA进行研究,而lncRNA命名的无规则性又使得我们无所适从。有时候一条lncRNA根据不同的命名方式,会有不同的命名。当然,如果这条lncRNA成名了,比如MALAT1(metastasis associated lung adenocarcinoma transcript 1),我们在做研究的时候就不会局限在肺癌中了,就像朝鲜的现任领导人是最成功的80后一个道理。

 

 

那lncRNA的命名原则有哪些呢?看下面详细lncRNA命名的五种方式介绍:

 

1. 根据lncRNA与疾病的关系,比如:

CCAT1:Colon cancerassociated transcript-1;

MIAT :myocardial infarction associated transcript,也叫RNCR2 (retinal non-coding RNA 2);

UCA1:Urothelial carcinoma associated 1 ,

HULC:Highly Upregulated in Liver Cancer。

 

2. 根据lncRNA与周围基因的位置,比如:

BACE1-AS:BACE1 antisense RNA;

HIF1A-AS2:LncRNA hypoxia inducible factor 1alpha antisense RNA-2

lincRNA HOTAIR:lincRNA HOX transcript antisense RNA;

HOTTIP:lncRNA HOXA transcript at the distal tip (HOTTIP)

而lncRNA asf的命名就直接是调控靶基因Fas的字母反过来。

 

3. 根据lncRNA与基因上下游的调控关系,比如:

BANCR:BRAF-regulated lncRNA 1,

ATB : lncRNA-activated by TGF-β,

PANDA:P21-associated noncoding RNA DNA damage-activated。

 

4. 根据lncRNA参与的生物学功能,比如:

LincRNA-ROR:Long Intergenic Non-Protein Coding RNA, Regulator Of Reprogramming,

Xist: X-inactive-specific transcript,

GAS5:growth arrest-specific 5。

 

5. 根据在细胞内的定位,比如:

Neat1: LncRNA nuclear-enriched abundant transcript 1。

 

当然,这是我们根据现在查到的分子进行总结的,有的就直接使用我们前面提到的ENST,RP等ID来用,也未尝不可。

 

如何命名未知功能的基因应遵循如下要求

未知功能的lncRNA应依据基因组上下文来命名。如果有一个很接近的蛋白编码基因,lncRNA的名字应该以这个编码基因名字开始,加后缀,这个后缀可以按下方式分类:反义(antisense,AS),BACE1-AS;内含子(intronic,IT),例如,SPRY4-IT1;重叠(overlapping,OT),例如,OSX2-OT;一些新的分类方法也应该考虑,特别对这些lncRNA,它们与编码基因是头碰头(head to head),因此推断它们拥有双向启动子,HGNC推荐命名这些lncRNA为反义上游(Antisense upstream,AU),例如,GENE2-AU1。

 

大家也应该注意到HGNC并不赞成以剪接变异体来命名,所以两个剪接变异体命名是以其中一个lncRNA基因来命名,例如GENE2-AS1;如果一个lncRNA基因编码的转录本跨多于一个蛋白编码基因,用lncRNA的5’末端的第一个蛋白编码基因来命名,例如GENE-AS2上述命名的基本架构适用于大多数lncRNA,但对于基因密集区域的lncRNA可能就不适用了,这种情况下,你应该与HGNC沟通来解决。

 

艾美捷科技优势代理品牌

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: