dna羟甲基化芯片

  • 简介
  • 优势
  • 实验流程
  • 结果展示
  • 客户案例
  •        dna 羟甲基化是一种重要的表观遗传修饰,对基因的表达起调控作用,在神经分化和癌症中发挥重要的作用。这种新的dna甲基化修饰形式—5羟甲基胞嘧啶修饰在哺乳动物细胞组织广泛存在。这种羟甲基化修饰被认为是双加氧酶家族tet通过氧化5甲基化胞嘧啶形成的。为深入了解5hmc的作用,我们就必须清楚5hmc在基因组的分布情况。然而,传统的基于重亚硫酸盐的方法无法区分5-hmc和5-mc。5-hmc单克隆抗体捕获法是研究dna羟基化修饰的利器,结合芯片技术以及生物信息分析,可以获得全基因组羟甲基化分布图,从而能帮助我们从一个新的角度来解析胚胎发育,神经细胞分化以及癌症发生的分子机制。

    康成生物为您提供羟甲基化芯片技术服务,可以快速便捷地确定5hmc在ncrna和mrna启动子区,以及其他一些重要的基因组区域的分布。您只需要提供保存完好的组织或细胞标本,康成的芯片技术服务人员就可为您完成全部实验操作,包括酶消化基因组dna、5’羟甲基化dna免疫共沉淀、hmedip与 input dna片段线性扩增、荧光标记、芯片杂交、图像采集和数据分析、并提供完整的实验报告。

    arraystar 4x180k 启动子芯片

           arraystar启动子芯片是专门为研究启动子区域的甲基化、羟甲基化、组蛋白修饰以及转录因子结合而设计的产品,覆盖所有refseq数据库基因的启动子区(arraystar refseq promoter array)或是所有非编码rna的启动子区(arraystar ncrna promoter array),能够满足不同客户的需求。180k的芯片,启动子的覆盖范围近2kb,并覆盖了几乎所有启动子区附近的cpg岛,是一款高品质高性价比的羟甲基化芯片产品。


    arraystar refseq启动子芯片产品列表

    芯片名称 物种 规格 覆盖范围
    arraystar human refseq promoter array human 4x180k 23,148 refseq promoters (-1,300 bp ~ 500 bp of tss)
    arraystar mouse refseq promoter array mouse 4×180k 22,327 refseq promoters (-1,300 bp ~ 500 bp of tss)
    arraystar mouse refseq promoter array rat 4×180k 15,987refseq promoters (-1,300 bp ~ 500 bp of tss)

    arraystar ncrna启动子芯片产品列表

    芯片名称 物种 规格 覆盖范围
    arraystar human ncrna promoter arrar human 4x180k 27,248 lncrna promoters (-1,300 bp ~ 500 bp of tss) 622 mirna promoter (-50 kb to mature mirna)
    arraystar mouse ncrna promoter array mouse 4×180k 18,552 lncrna promoters (-1,300 bp ~ 500 bp of tss) 346 mirna promoter (-50 kb to mature mirna)


    arraystar 癌症相关甲基化芯片

    arraystar 4 x 180k block芯片

           arraystar 4 x 180k block芯片是专门为研究癌症相关的block区域而设计的产品,覆盖位于7088个block区域中的2554个蛋白编码基因、8481个长链非编码rna、463个mirna genes。通过这款芯片可以检测block区域中的基因和lncrna的甲基化变化,组蛋白修饰以及转录因子结合情况。此外,结合arraystar block表达谱芯片,还可以了解甲基化变化与基因表达水平间的联系。

    芯片名称

    物种 规格 覆盖范围
    arraystar human block array human 4x180k 27mb。位于7088个block区域中的2554个蛋白编码基因、8481个lncrna、463个mirna genes

           最新研究表明:癌症中存在着一些低甲基化的区间(block),这些区间的长度在5kb到10m之间,长度中位值为28kb。1/3的基因转录起点都位于这些block中。此外,这些低甲基化的block与包括lads*和locks*在内的异染色质区域存在着很大重叠,表明癌症中的甲基化变化与染色质结构改变之间存在着很大的关联性。此外,低甲基化block中包含了绝大部分在肿瘤中表达变异较大的基因。而且,这些区域不仅整体甲基化水平下降,而且相对于正常样品,它们在不同肿瘤样品中甲基化水平变化更加剧烈。这表明:基因在癌症中的平均表达水平和平均甲基化程度固然很重要,它们在不同样品中的均一性也不容忽视,甚至是更加重要。

    *:lads:与核纤层蛋白结合的dna区域。 locks(large organized chromatin lysine modifications):富含异翻译后修饰(例如:组蛋白h3k9二甲基化修饰)的异染色质区域。


     

    图1. 26个位于低甲基化block区域内的高变异基因的标准表达值(log转化后)。这些基因在肿瘤样品(红色点)中展现出剧烈的表达变异,而在正常样品(蓝色点)中表达变异很小。


    arraystar 4 x 180k dmr芯片

           arraystar 4 x 180k dmr芯片是专门为研究癌症相关的差异甲基化区域而设计的产品,覆盖12113个与癌症、组织及细胞分化相关的small dmrs, 以及11380个与这些small dmrs相邻的cpg岛及cpg岛岸。通过这款芯片不但可以检测癌症相关的甲基化变化,还可以了解引起这种甲基化变化的cpg岛边界漂移模式,从而更加全面直观的解析癌症甲基化组。

    芯片名称 物种 规格 覆盖范围
    arraystar human dmr array human 4x180k 51mb 。12113个与癌症、组织及细胞分化相关的small dmrs, 以及11380个与这些small dmrs相邻的cpg岛及cpg岛岸

           癌症中,除了低甲基化的长区间(block),还存在着许多长度小于5kb的差异甲基化区域(dmrs),被称为small dmrs。大部分癌症或组织特异性的差异甲基化区域(small dmrs)都位于cpg岛边缘2kb以内;相对于cpg岛,这一cpg密度较低区域称之为cpg岛岸(cpg shore)。癌症中,cpg岛边界发生漂移,从而导致cpg岛岸的甲基化水平发生变化:当cpg岛边界向cpg岛内部移动时,cpg岛岸发生超甲基化;当cpg岛边界向外移动时,cpg岛岸发生低甲基化。cpg岛边界的变化导致了基因表达的改变(图1)。


     

    图1. dmr区域丧失甲基化稳定性的模式。图中横轴代表基因组特定区域,纵轴代表相应位点的甲基化程度,蓝色的线代表正常样品,红线代表癌症样品,dmrs区域用粉红色的背景标记。癌症相关的甲基化变化可以分为四类主要的模式:(a)甲基化边界外移;(b)甲基化边界内移;(c)甲基化边界消失;(d)通过去甲基化形成的新的dmr区域。



  • 一站式服务:客户只需要提供保存完好的组织或细胞标本,康成的芯片技术服务人员就可为您完成全部实验操作(图1)和数据分析流程,并提供完整的实验报告。
    hmedip富集效果特异性佳:hmedip是获得准确测序数据的关键。康成在表观遗传领域有着丰富的经验,hmedip平台经过不断地优化,抗体富集效率高和特异性好。
    严格的质控体系:康成生物在hmedip-chip每个关键步骤都加入了质控实验。这些qc数据能够评估每个步骤的实验质量。如果达不到标准,我们会重复实验步骤或者优化实验体系,使得每个样品都能够达到质控标准(图1,2)。


    丰富的生物信息学分析:除了严谨,可靠的实验体系,康成生物还有强大的生物信息学团队,为客户提供paper级的图表和深入的数据分析服务
  • 1.超声打断基因组
           将基因组dna超声打断成400bp-500bpdna片段
    2. 羟甲基化dna免疫共沉淀
           a)  加热变性并将变性后的单链dna样品分成两份
           b)  其中一份单链dna样品加入抗5’-羟甲基化胞嘧啶核苷抗体
           c)  用免疫磁珠法分离b步样品中5’羟甲基化dna片段的抗体复合物,样品中其余的非甲基化dna片段被清洗掉
           d)  纯化免疫共沉淀的dna片段(hmedip)
           e)评估免疫共沉淀的富集效率
    3. hmedip与 input dna片段线性扩增
           使用sigma wga kit对上述两份dna片段(hmedip 与 input)进行扩增。该步骤使检测的灵敏度得到大幅度提升,用微量的检测样品就能得到精确的检测结果
    4. 荧光标记
            对hmedip(cy5)与input(cy3)样品分别进行标记
    5. 芯片杂交

           标记后的hmedip与input样品混合、变性,与甲基化微阵列检测芯片杂交
    6. 图像采集和数据分析

           用高解析度芯片扫描仪检测杂交信号;用专业商用分析软件对杂交结果进行数据提取、标准化、峰值分析、报告
    7. 提供实验报告:包括详细的实验方法和芯片实验数据和图表
           ● scanning image:cy3、cy5荧光扫描图像
           ● raw data:包括每个探针的荧光信号强度原始数据
           ● probe report:经过校正得到每个探针的log2(hmedip/input)值以及p-value值。
           ● log2(hmedip/input)值代表每个探针在hmedip dna和input dna中的相对富集强度, p-value表示探针红绿信号差异是由非生物因素造成的概率;p-value越低,表示该探针越有可能代表一个甲基化事件,p-value由修正的ks检验算法计算
           ● peaks report:peaks代表可能的dna羟甲基化区域,由专业商用软件计算,报告包括可能的peaks的染色体定位信息以及peaks周围的基因和cpg岛的相关信息
           ● summary report:提供多样本之间peaks区域的比较以及汇总以提供参考
    8. differential enrichment peaks(advanced analysis)
           differential enrichment peaks(dep)利用重复组中多样本log2ratio的平均值分析组间差异甲基化区域,从而使得用重复样本实验数据进行甲基化结果的比较及差异甲基化区域的鉴定成为可能,这对于后续实验及分析是非常重要的。

  • 康成生物基本数据分析展示

    1.羟甲基化峰识别和注释:

           为了消除系统误差和芯片间差异。分别使用中值标准化,quantile标准化和线性平滑的方法对芯片数据做标准化。标准化后的数据使用nimblescan v2.5 (roche-nimblegen)识别羟甲基化峰(peaks)。将找到的羟甲基化峰根据转录本promoter和cpg density的信息做注释。

           许多研究表明启动子羟甲基化和下游基因的转录抑制间有密切的关联。据报道,哺乳动物中基因启动子的羟甲基化状态与其gc含量有关。因此我们基于cpg ratio,gc含量和cpg丰富区长度,将启动子分成如下三类:

           * 高cpg密度启动子(hgh cpg-density promoter, hcp): 首先我们定义启动子区为tss上游0.7kb ~ tss下游0.2kb。该区域内若有任意一个500bp的窗口,其g c比例 >= 0.55,并且cpg观测/期望比 (observed/expected, o/e) >= 0.6。

           * 低cpg密度启动子(low cpg-density promoter, lcp): 启动子不包含cpg o/e >= 0.4的500bp长的区域。

           * 中cpg密度启动子(intermediate cpg-density promoter, icp): 不属于hcp或icp的启动子。

           康成生物分别提供了不同类型的启动子区域(hcp,icp,lcp)的羟甲基化分析结果。下面以hcp为例,展示了羟甲基化峰注释表格。

           enrichmentpeaksinhcp表格:每一个样品中对应到hcp的peaks,包括hcps和peaks的详细信息。

           summaryepinhcp表格:所有样品中对应到hcp的peaks数目,表格中不包括peaks的详细信息,用计数的方式表示某个hcp在特定样品中的对应的peaks数目。 


    2.差异羟甲基化(dep)分析

           两组样品进行比较,筛选差异富集峰(dep)即差异羟甲基化区域的。我们使用每组log2-ratio的均值,并为每个探针计算m’ value。然后将结果导入nimblescan进行peak finding,找到的peaks便是差异羟甲基化区域(dep)。康成生物分别提供了不同类型的启动子区域(hcp,icp,lcp)的差异羟甲基化分析结果。下面以hcp为例,展示了差异羟甲基化表格。适用范围:两个或两组样品间的比较。

           depinhcp表格:每个比较中找到对应有hcp的dep。

           control vs expriment比较中在chr1上1235129~1235386区域的peak。该peak对应的是acap3基因的启动子,这个启动子属于hcp类型。


           summaryinhcp 表格:所有比较对应有hcp的dep。表格中不包括peaks的详细信息,用计数的方式表示某个hcp在特定比较中的dep数目。

           以下表第一行为例:显示的是expriment vs control比较中有一个dep在基因aadat的启动子上,这个基因的启动子属于hcp类型启动子。


    3.差异羟甲基化基因的go分析

           为了方便客户了解启动子差异羟甲基化基因的功能,康成生物还分别提供了差异羟甲基化基因的go分析。

           适用范围:两组或多组数据比较获得的差异羟甲基化的基因。


    4.差异羟甲基化基因的pathway分析

           为了方便客户了解启动子差异羟甲基化基因参与的生物学过程,康成生物还分别提供了差异羟甲基化基因的pathway分析。

           适用范围:两组或多组数据比较获得的差异羟甲基化的基因


    5.可视化

           康成生物提供gff 格式的hmedip-chip羟甲基化谱数据,可以通过signalmap软件进行可视化。通过可视化话图,客户可以直观的了解具体区域或基因的羟甲基化情况,已经样品间的差异羟甲基化状况。

    用signal map显示样品间差异甲基化区域。

    图中红色为样品1,蓝色为样品2.

    ep:单个样品中羟甲基化富集的区域(enrichment peak); 

     dep:样品间差异羟甲基化区域(differentially enrichment peak)


    高级数据分析结果展示

           表达谱数据(mrna, lncrna, mirna) &羟甲基化芯片数据联合分析

           通过表达谱数据和羟甲基化芯片数据联合分析,可以找出受甲基化调控的mrna,lncrna和mirna。下面的两个图为mrna表达谱数据与相应羟甲基化芯片联合分析结果。适用范围:同时具表达谱数据和羟甲基化谱数据的样。

    * 联合分析列表

    上图:展示了羟甲基化芯片结果d40 vs d20羟甲基化程度增加且表达谱芯片结果d40 vs d20 表达下调2.0倍的基因


  • 致癌物诱发肝癌的早期诊断分子标记物(dynamic changes in 5-hydroxymethylation signatures underpin early and late events in drug exposed liver. john p. thomson. et al.nucleic acids research 2013.)

           研究者应用小鼠模型来研究致癌药物诱导肝癌过程中肝脏dna羟甲基化和甲基化图谱的变化。分别采用hmedip-chip和medip-chip方法对摄入苯巴比妥钠1天(n=5), 7天(n=5), 28天(n=5)和91天(n=5)以及相应对照小鼠的肝脏dna羟甲基化和dna甲基化进行检测,发现dna羟甲基化的变化要早于dna甲基化。小鼠肝脏dna羟甲基化在药物摄入1天后就发生了改变,聚类分析表明这些变化位点在组内的样品(n=5)中重复性高,证明羟甲基化的改变不是随机的变化,非常稳定。结合表达谱的数据,研究者发现摄入药物后dna羟甲基化水平的改变和基因表达的变化显著相关,其中包括药物代谢的重要酶p450家族成员。综合考虑基因表达的变化和羟甲基化的改变,研究者筛选到6个基因的启动子区段的dna羟甲基化作为癌症早期诊断的分子标志物,其中包括和多种肝脏肿瘤相关的非编码rna meg3。


    技术路线:


    结果展示:

    *图释:苯巴比妥摄入1天后小鼠肝脏的羟甲基化水平就发生了改变,用生物信息学算法找到启动子(pprs)羟甲基化水平发生变化的基因,用升高(hyper)前100,,降低(hypo)前100,以及随机挑选的100个基因的启动子dna羟甲基化的变化值做热图。蓝色为羟甲基化水平升高,红色为羟甲基化水平下降。如图所示,这些变化位点在组内不同个体间重复性高,证明不是随机的变化。