lncrnas的详细注释和功能分析

arraystar lncrna芯片包括详细系统的lncrna注释、分类和分析,用以深入了解lncrna的复杂生物学功能。已报道的与生物学过程或人类疾病相关的lncrnas正在被研究、注释、交叉引用。这些丰富的信息来源有助于揭示lncrnas的功能作用和分子机制。 

基因组结构     根据lncrnas在基因组上相对于蛋白编码基因的位置关系,可以系统地将其分为 (1) intergenic (lincrna),(2) intronic,(3) bidirectional,(4) sense-overlapping,(5) antisense ,(6) pseudogene这6种类型 (图 1),这种位置关系有助于推测lncrna的功能,包括调控方式是顺式(cis)还是反式(trans),调控层面是转录还是转录后(图 2)。

图1. 根据lncrna和蛋白编码基因的不同位置关系进行分类。


图2. lncrnas可以通过不同机制调控基因表达,例如招募染色质重构复合体,在表观层面调控基因表达;作为增强子rna发挥功能;影响核内亚结构 ;影响核质转运过程;通过mirnas介导的cerna机制发挥作用;影响mrna的稳定性及翻译;通过顺式或反式调控的方式,在转录或转录后水平发挥调控作用。


表观基因组信息*    lncrnas的转录过程受到启动子或者增强子调控。启动子和增强子是经典的dna顺式调控元件,带有各自特有的表观遗传标记。活跃的启动子或增强子自身也是转录单位,能产生有功能的非编码rna。因此,可根据表观基因组信息(如dnase i超敏位点)将lncrna分为启动子-lncrna(p-lncrna)和增强子-lncrna(e-lncrna)。其中,根据基因组结构,可将p-lncrna进一步细分为intergenic p-lncrna和divergent p-lncrna(图3)。p-lncrna的表达常和该启动子调控的蛋白编码基因的转录水平存在正相关关系; 而e-lncrna则可以捕获转录因子到转录位点、调节染色体结构、组织形成细胞核三维拓扑结构域等,从而调控靶基因的转录。

图3. 根据表观基因组信息和基因组结构将lncrna分类。根据lncrna的转录起始位点(tss)、蛋白编码基因tss以及不同的dhs (启动子dhs( h3k4me3标记)或增强子dhs( h3k4me1, h3k27ac 和 h3k9ac标记))的位置关系可将lncrna分为intergenic p-lncrna,divergent p-lncrna,e-lncrna和其它lncrna。


序列完整性*    完整的lncrna 5’末端序列和3’末端序列对于lncrna的后续研究至关重要,比如查找lncrna的精确转录起始位点和启动子区域,以及crispr-cas系统靶点设计等。根据序列完整程度, lncrna分别注释为complete 5’end、complete 3’end 和 full length等三类。

亚细胞定位**     lncrna的分子功能与其所在的亚细胞位置密切相关。比如,位于细胞核或染色体上的lncrna常通过影响表观遗传修饰和转录过程来调控基因表达。细胞质中的lncrna则更可能参与翻译调控或通过吸附mirna来发挥cerna功能。

mirna识别位点      预测或经实验验证的mirna识别位点可以很好地帮助客户寻找lncrna在mirna调控网络中的潜在调节功能,如作为cerna发挥作用。

高度保守的lncrnas      基因组中高保守区域(ucr) 或高保守非编码元件 (ucnes) 转录出来的lncrnas可能具有重要的生物学功能。由于许多 lncrna通过顺式作用调控靶基因,因此在其他物种中与人类基因组结构相同的lncrnas(即使只有中度同源)也会被收录。与全序列保守性相比,基因组结构与基因调控的关系更加密切。

组织特异性lncrnas*      lncrnas呈现出严格的组织或时序特异性,其功能可能与其特异性表达的组织直接或间接相关。芯片注释特别标示出与细胞谱系或癌症相关的lncrnas分子。

疾病相关 lncrnas*    包含了lncrnadisease数据库中收录的已知与疾病相关的lncrnas,便于临床和医学转化研究。

短肽编码潜能*  虽然大部分lncrna不具备蛋白编码功能,但有些lncrna含有小的开放阅读框(smorfs),具备编码短肽的能力。芯片注释包含了lncrnawiki数据库中预测或实验验证过的短肽编码信息。



相关服务

lncrna芯片技术服务>>