染色质免疫共沉淀测序

  • 简介
  • 优势
  • 实验流程
  • 结果展示
  • 客户案例
  • sci成果
  •        染色质免疫共沉淀技术(chromatin immunoprecipitation,chip)是研究体内蛋白质与dna相互作用的有力工具,利用该技术不仅可以检测体内反式因子与dna的动态作用,还可以用来研究组蛋白的各种共价修饰以及转录因子与基因表达的关系。

           结合高通量的新一代测序技术(illumina hiseq),通过对染色质免疫共沉淀(chip)富集得到的dna片断进行大规模测序,研究人员可获得数百万条序列标签,并能把所关注的蛋白的dna结合位点精确定位到基因组上,从而获得全基因组范围内组蛋白各种修饰状态、转录因子结合位点的高分辨率分布图。染色质免疫共沉淀测序(chip-seq)是继chip-chip之后,蛋白/核酸相互作用研究领域的又一技术突破。高质量、高通量、低成本的数据产出,为表观遗传组学研究提供了一套全新高效的技术工具。


    染色质免疫共沉淀测序应用领域: 

           组蛋白修饰,转录因子,rna polymerase ii,转录因子等。

    上图:染色质免疫共沉淀技术已应用于检测组蛋白各种共价修饰、ctcf、rna polymerase ii以及各种转录因子等dna结合蛋白在基因组上的精确定位,为表观遗传组学与基因转录调控机制研究提供了又一有力工具。(摘自park p.j, 2009,nature reviews genetics)


  • ● 一站式服务:客户只需提供样品,康成的技术服务人员就可为您完成全部实验操作,包括染色质免疫共沉淀、ip与 input dna文库构建、高通量测序和数据分析、并提供完整的实验报告。

    ● 严格的质控体系:康成生物在hmedip-seq每个关键步骤都加入了 质控实验(图2,3)。这些qc数据能够评估每个步骤的质量。如果达不到标准,我们会重复实验步骤或者优化实验体系,使得每个样品都能够顺利进入下个实验环节。
    ● 优化的文库制备流程:单管式建库,减少了由于反复纯化造成的样本损失,节省珍贵样品。
    ● 专业的生物信息分析:强大的生物信息团队,提供专业的生信分析和paper级的图表。
  • 1. 染色质免疫共沉淀(chip)

    2. 文库构建:
          dna末端修复 
          将'a’ 碱基加到 dna片段末端
          dna片段末端加接头(adaptors)
          pcr扩增
          凝胶电泳分离纯化
    3. dna成簇(cluster)扩增
          dna加到flow cell 表面
          桥式pcr(bridge pcr)成簇扩增
    4. 高通量测序
    5. 数据分析
        a.  基本数据分析
         *原始数据读取(raw data, total reads)
         *有效数据获取(clean and mappable reads)
         * 确定富集区域(peak finding)

         *富集区注释(peak annotation)

         * 富集区相关基因的go和pathway

         * 数据可视化
        b.高级数据分析
         chip-seq&表达谱数据联合分析
    6. 提供实验报告  
     


  • 康成生物基本数据分析展示

    1.  reads统计

           测序后,下表中列出了测序的基本信息和测序片段计数统计,包括原始测序reads计数(pass filter reads)和基因组比对唯一位置reads(uniquely aligned reads)计数。


    sample a
    测序类型(单端/双端)
    单端
    reads长度
    100bp
    物种
    homo sapiens
    基因组版本
    hg19
    (经过illumina chastity过滤)
    31,345,987
    比对到基因组唯一位置的reads
    26,121,682
    *图释:测序基本信息和片段计数统计。clean reads代表经过illumina质控的高质量reads。唯一比对reads是比对到人类参考基因组hg19基因组唯一位置的reads数。
     
    2. 富集区域(“峰”)识别
           经过对测序reads的富集分析,抗体免疫捕获的片段情况能够被还原,可以用reads富集峰(peak)代表tfs在dna上的结合区域。uniquely aligned reads的分布情况经过与macs软件构建的possion模型相比较,可以鉴定出有统计学意义的显著富集的区域(“峰”)。


    *图释:富集区域识别结果。


    3. 富集区域(“峰”)注释
           富集峰使用ucsc refseq数据库中与之最邻近的基因(基因的tss与峰中心最近)进行注释。根据这些富集峰相对于基因的位置,我们将它们分为5类(图2):
           1)  启动子峰:峰中心位于启动子区(-2000bp ~ 2000bp)的峰;
           2)  上游峰:峰中心位于启动子上游(-20000bp ~ -2000bp)的峰;
           3)  内含子峰:峰中心位于内含子区的峰( 2000bp ~ tts区间内的内含子)
           4)  外显子峰:峰中心位于外显子区的峰( 2000bp ~ tts区间内的外显子)
           5)  基因间峰:不属于以上四类的峰

    *图释:五种类型峰位置


     

    *图释:chip-seq富集峰注释


     
    *图释:五类峰的比例
     
    4.  tss附近chip-seq信号分布
           在研究转录因子时,人们经常关注于tss周围的峰位置和信号,因此根据所有基因tss的位置和chip-seq信号,我们绘制了tss周围20kb的chip-seq信号分布。如图4所示,在所有基因的tss周围2kb以内的峰所占比例较高。
    *图释:tss周围chip-seq信号分布
     
    5. 富集峰相关基因的go分析
           go分析是利用go分类信息对富集区域相关的基因功能分类或定位分析。go分类主要分3部分: biological process(生物学过程),cellular component(细胞组分)和molecular function(分子功能)。
    *图释:富集峰相关基因的富集细胞组分,可能暗示了tf的调控功能。
     
    6.  富集峰相关基因的kegg pathway分析
           基于最新kegg(kyoto encyclopedia of genes and genomes)数据库,富集峰相关基因的通路分析允许用户确定这些基因在kegg中显著富集的生物学通路。这可能暗示了tf涉及到的通路。
    *图释:富集的kegg通路。与富集峰相关的基因涉及到p53信号通路中,暗示tf可能涉及到p53信号通路的调节。
     
    7.  chip-seq信号可视化(ucsc genome browser)
          康成生物提供了每个样品的wig文件,以在ucsc genome browser中进行可视化(图7)。
     
     
    *图释:b3gnt1基因启动子区的chip-seq信号谱(ucsc genome browser)。
     
    康成生物高级数据分析展示
           chip-seq &表达谱数据(mrna,lncrna,mirna)联合分析
           表达谱数据提供了lncrna、mirna和mrna的表达信息,而chip-seq可以获得基因的不同组蛋白修饰或是转录因子结合信息,结合这两种信息能够研究不同组蛋白修饰或转录因子结合与基因表达的关系。
    *图释:不同表达量基因的chip-seq信号。根据基因表达水平,将它们分为4类,以不同颜色表示(红色:高表达基因;绿色:中等表达基因; 蓝色:低表达基因;紫色:沉默基因)。x轴:相对于tss的位置;y轴:tags/5bp。tags越多,基因表达水平高;反之,基因表达水平低,提示h3k4me3对基因表达起正调控。
     
    *图释:不同表达量基因的chip-seq信号。黑色虚线代表基因表达水平,彩色代表不同组蛋白修饰(红色:h3k4me1;绿色:h3k4me2; 蓝色:h3k4me3)。可以看出h3k4的不同甲基化形式与基因表达都呈正相关。




  • 小儿神经胶质瘤的组蛋白修饰和基因表达调控()

           重度小儿神经胶质瘤患者的组蛋白h3会发生k27m突变(h3.3k27m),导致整体h3k27me2和h3k27me3 减少。作者通过chip-seq比较正常神经干细胞(nsc)和小儿神经胶质瘤细胞(sf7761和sf8628)的h3k27me3修饰,分析发现nsc和sf7761分别有3912和1712个基因启动子区域发生h3k27me3修饰。结合rna-seq,h3k27me3修饰与基因表达呈负相关。对差异h3k27me3修饰的基因进行go分析和pathway分析,发现很多信号通路都是与癌症相关的。该项工作揭示了小儿神经胶质瘤的发病机制,从中可以筛选小儿神经胶质瘤的生物标志物,并为治疗提供了可能的靶点。
     
    技术路线:
     
    *图释:神经胶质瘤细胞中癌症相关基因h3k27me3水平发生改变。a: 神经胶质瘤细胞sf7761中h3k27me3水平和神经干细胞(nsc)相比整体较低,某些具体的位点呈升高趋势。b: nsc和sf7761 中h3k27me3结合位点的韦恩图。 c: 差异的基因分布在癌症相关的信号通路中。(chan, fang et al. 2013)


  • → mecp2, a target of mir-638, facilitates gastric cancer cell proliferation through activation of the mek1/2-erk1/2 signaling pathway by upregulating git1. oncogenesis. 2017

    → oxidized guanine base lesions function in 8-oxoguanine dna glycosylase1-mediated epigenetic regulation of nuclear factor kappab-driven gene expression. the journal of biological chemistry. 2016