CCCTC-结合因子; CTCF

转录抑制子 CTCF

HGNC 批准的基因符号:CTCF

细胞遗传学位置:16q22.1 基因组坐标(GRCh38):16:67,562,526-67,639,185(来自 NCBI)

▼ 说明

转录绝缘体是 DNA 元件,它为增强子和沉默子元件的作用设定界限,从而将真核基因组组织成调节域(Kuhn 和 Geyer,2003)。所有脊椎动物绝缘体似乎都使用多功能 CTCF 蛋白。 CTCF 使用其 11 个锌指的各种组合来识别各种不相关的 DNA 序列。一旦与 DNA 结合,CTCF 就可以充当转录绝缘子、阻遏子或激活子,具体取决于结合位点的情况(Jeong 和 Pfeifer,2004)。

▼ 克隆与表达

菲利波娃等人(1996) 分离并分析了人类 CTCF(CCTCC 结合因子)cDNA 克隆。他们表明,人类 CTCF 蛋白含有 11 个锌指结构域,并且高度保守,与禽类 CTCF 氨基酸序列有 93% 的同一性。 CTCF 包含 2 个可转移至异源 DNA 结合域的转录抑制域。 Northern 印迹分析显示,人类 CTCF 基因以大约 4 kb 的转录本形式普遍表达。

伊德拉阿卜杜拉等人(2014) 指出 7 个 CTCF 蛋白亚型的迁移表观分子量范围为 55 至 130 kD。 CTCF 可在某些组织中通过磷酸化、苏酰化和聚(ADP-核糖基)化进行翻译后修饰。它还可以自身二聚化和多聚化,并作为异二聚体与多个蛋白质伴侣相互作用。

▼ 测绘

通过 FISH,Filippova 等人(1998) 将 CTCF 基因定位到染色体 16q22.1 的一个小重叠区域,这是散发性乳腺和前列腺肿瘤中常见的染色体缺失,表明 CTCF 是候选抑癌基因。

▼ 生化特征

晶体结构

李等人(2020) 表明 CTCF N 末端内的片段与人粘连蛋白的 SA2(300826)-SCC1(600925) 亚基相互作用。他们报道了 SA2-SCC1 与 CTCF 复合物的晶体结构,分辨率为 2.7 埃,揭示了相互作用的分子基础。李等人(2020) 证明这种相互作用是 CTCF 锚定环特别需要的,并且有助于粘连蛋白在 CTCF 结合位点的定位。类似的基序存在于许多已建立的和新鉴定的粘连蛋白配体中,包括粘连蛋白释放因子 WAPL(610754)。李等人(2020) 得出的结论是,他们的数据表明 CTCF 通过保护粘连蛋白免于环释放来实现染色质环的形成。

▼ 基因功能

菲利波娃等人(1996) 发现 CTCF 特异性结合鸡、小鼠和人 MYC(190080) 癌基因启动子近端区域的调节序列。在小鼠和人类 MYC 基因中,紧邻主要 P2 启动子下游发现了一个 CTCF 结合位点。小鼠和人类细胞核提取物的凝胶位移测定表明 CTCF 是与该序列结合的主要因子。 P2 近端 CTCF 结合位点的突变分析和瞬时共转染实验表明 CTCF 转录抑制人类 MYC 基因。尽管禽类和人类 CTCF 蛋白的 DNA 结合域具有 100% 的序列同一性,但鸡和人类 MYC 启动子中 CTCF 识别的调控序列明显不同。接触核苷酸的突变证实了 CTCF 与人 MYC 基因的 P2 启动子的结合需要许多独特的接触 DNA 碱基,而鸡 MYC 基因的 CTCF 结合位点中不存在这些碱基。此外,蛋白水解保护测定表明,与鸡位点相比,更多的 CTCF 锌指参与接触人 CTCF 结合位点。利用连续删除的锌指结构域进行的凝胶迁移测定表明,CTCF 锌指 2 至 7 参与与鸡 MYC 启动子的结合,而指 3 至 11 介导 CTCF 与人启动子的结合。锌指使用的这种灵活性表明 CTCF 是一种“多价”锌指结构。转录因子。

贝尔等人(1999) 鉴定了鸡 β-珠蛋白绝缘体的 42 bp DNA 片段,它对于人类细胞中的增强子阻断活性是必要且充分的。他们表明,FII 序列是 CTCF 的结合位点,并且这些 CTCF 结合位点存在于所有检查的脊椎动物增强子阻断元件中。贝尔等人(1999) 表明 CTCF 的定向增强子阻断是脊椎动物基因调控的保守组成部分。

Bell 和 Felsenfeld(2000) 以及 Hark 等人(2000) 孤立表明 CTCF 与 H19(103280) 和 IGF2(147470) 之间的非甲基化印记控制区域(ICR1; 616186) 内的几个位点结合,这对于增强子阻断至关重要。哈克等人(2000) 证明 CTCF 结合被 ICR1 的 DNA 甲基化消除。 CTCF 结合位点内 CpG 的甲基化消除了 CTCF 的体外结合,而这些位点的删除导致体内增强子阻断活性的丧失,从而允许基因表达。这种 CTCF 依赖性增强子阻断元件充当绝缘体。 Bell 和 Felsenfeld(2000) 提出,它控制 IGF2 的印记,并且该绝缘体的活性通过父本等位基因的特定 DNA 甲基化而限制于母本等位基因。 Bell 和 Felsenfeld(2000) 得出结论,DNA 甲基化可以通过调节增强子边界来调节增强子与基因启动子的接触,从而控制基因表达。

DM1 基因座上 CTG 重复序列的扩增会通过改变 2 个相邻基因 DMPK(605377) 和 SIX5(600963) 的表达以及包含重复序列的 RNA 的毒性作用,导致强直性肌营养不良。菲利波娃等人(2001) 鉴定了位于 CTG 重复序列侧翼的 2 个 CTCF 结合位点,并在 DMPK 和 SIX5 之间形成绝缘体元件。这些位点的甲基化阻止了 CTCF 的结合,表明先天性强直性肌营养不良中的 DM1 位点甲基化会破坏绝缘体功能。此外,CTCF 结合位点与其他几个位点的 CTG/CAG 重复序列相关。菲利波娃等人(2001) 提出了 CTG/CAG 重复作为人类基因组多个位点的绝缘体元件的组成部分的一般作用。

曹等人(2002) 将绝缘体和转录因子 CTCF 鉴定为小鼠 X 染色体选择的候选反式作用因子。选择/印记中心包含串联 CTCF 结合位点,可在增强子阻断测定中发挥作用。体外结合会因 CpG 甲基化而降低,并因包含非 CpG 甲基化而消除。曹等人(2002) 假设 Tsix(300181) 和 CTCF 共同建立了一个用于 X 失活的可调节表观遗传开关。小鼠 Tsix 包含超过 40 个 CTCF 基序,而人类序列则超过 10 个。

两个非编码基因座 TSIX 和 XIST(314670) 通过控制同源染色体配对、计数和要失活的染色体的选择来调节 X 染色体失活。多诺霍等人(2007) 发现成对的 Ctcf-Yy1(600013) 元件在小鼠 Tsix 的计数/选择和印记域内高度聚集,并且他们指出成对的 YY1-CTCF 位点的类似聚集发生在人类 X 失活中心。免疫沉淀和蛋白质下拉实验显示Ctcf和Yy1之间直接结合,突变分析表明最高亲和力相互作用发生在Yy1的锌指和Ctcf的N末端之间。多诺霍等人(2007) 发现 Yy1 +/- 小鼠胚胎干细胞具有不适当的 Tsix 下调和 Xist 上调,并且通过 RNA 干扰敲低 Ctcf 产生了相同的表型。

通过组合使用其 11 个锌指,CTCF 可以与具有显着序列变异的约 50 bp 的靶位点结合。不同的 CTCF-DNA 复合物(其中一些对甲基化敏感)的形成会产生不同的功能,包括基因激活、抑制、沉默和染色质绝缘。锌指突变或靶标异常选择性甲基化导致的靶标特异性谱的破坏与癌症相关。奥尔森等人(2001)指出CTCF是一种肿瘤抑制基因。然而,CTCF 在印记中的作用表明其功能丰富性与其他肿瘤抑制基因无关。还提出了 CTCF 在自然选择中的关键作用,因为它涉及某些基因表达的功能性和稳定半合性的诱导。

通常,CTCF 和 CTCF 旁系同源物 BORIS(CTCFL; 607022) 以相互排斥的模式表达,与雄性生殖细胞分化过程中甲基化标记的重置相关。 BORIS 在 CTCF 靶位点指导表观遗传编程的建议影响了人类 BORIS 不仅在多种人类癌症中异常激活,而且对应到染色体 20q13 上与癌症相关的扩增区域的观察结果。克列诺瓦等人(2002)表明,癌症中 BORIS 的异常表达引起的竞争可能会干扰 CTCF 的正常功能,包括生长抑制,并导致表观遗传失调,这是人类癌症的一个常见特征。

Ishihara 和 Sasaki(2002) 在小鼠 7 号染色体上的 H19 和 L23mrp 之间的基因间区域中鉴定出 CTCF 的结合位点。该位点在人和小鼠之间是保守的,与主要的 DNase I 超敏位点相关,并且在体内与 CTCF 结合。使用报告基因构建体的功能测定表明,该元件可以充当该印记结构域的 3-prime 边界的绝缘体。作者假设 CTCF 依赖性绝缘体不仅可以调节,还可以界定印记域。

尽管已经发现了必需的DNA甲基转移酶,但调节等位基因甲基化的序列特异性建立和维持的蛋白质尚未确定。甲基化的候选调节因子之一是锌指蛋白 CTCF,它与 IGF2 和 H19 基因的印记控制区(ICR) 结合。未甲基化的母体 ICR 是一个染色质边界,可防止远处增强子激活 IGF2。体外实验表明,CTCF 介导母体 ICR 的边界活性,而父体 ICR 的甲基化通过阻止 CTCF 结合来消除这种活性。 Schoenherr 等人使用 ICR 中所有 4 个 CTCF 位点都有点突变的小鼠(2003) 表明,新生小鼠中母系遗传的突变 ICR 获得了显着但异质的甲基化程度。然而,卵母细胞和囊胚中的突变 ICR 并未甲基化,这表明在卵子发生过程中不需要 CTCF 的结合来建立未甲基化的 ICR。作者还表明,突变型 ICR 缺乏增强子阻断活性,因为 IGF2 的表达在突变型母体染色体上被激活。相反,母体 H19 表达减少,表明 CTCF 在该基因的转录中发挥积极作用。据说这是 CTCF 在 ICR 中的多种功能的首次体内演示。

费多里夫等人(2004) 使用基于转基因 RNA 干扰(RNAi) 的方法来产生 CTCF 蛋白含量减少的卵母细胞,并发现 H19 差异甲基化结构域的甲基化增加,并降低 CTCF 缺陷卵母细胞的发育能力。费多里夫等人(2004) 得出结论,CTCF 保护 H19 差异甲基化结构域在卵母细胞生长过程中免遭从头甲基化,并且是正常植入前发育所必需的。

于等人(2004) 将聚(ADP-核糖基) 化确定为调节 CTCF 绝缘体活性的翻译后机制,这增加了其多功能性和有效管理表观遗传程序的能力。

基因转录可以通过染色体环由远程增强子或绝缘子区域调节。 Ling 等人使用染色体构象捕获和荧光原位杂交的改良方法(2006) 发现小鼠 7 号染色体上 Igf2/H19 ICR 的 1 个等位基因与小鼠 11 号染色体上 Wsb1(610091)/Nf1(613113) 的 1 个等位基因共定位。Ctcf 的省略或母体 ICR 的删除消除了这种关联并改变了这种关联。 Wsb1/Nf1 基因表达。凌等人(2006) 得出的结论是,他们的发现证明 CTCF 可能通过将远处的 DNA 片段引导到一个共同的转录工厂来介导染色体间关联,并且数据提供了不同染色体上基因区域之间的远程等位基因特异性关联的模型,这表明DNA 重组和 RNA 转拼的框架。

Splinter 等人使用胚胎小鼠红系祖细胞(2006) 表明 Ctcf 与 β-珠蛋白位点(141900) 中的 Ctcf 结合位点相互作用。有条件地删除 Ctcf 和有针对性地破坏 DNA 结合位点会破坏这些长程相互作用的稳定性,并导致组蛋白乙酰化的局部丧失和组蛋白甲基化的增加,显然不会影响该位点的转录。

Ishihara 等人使用酵母 2-杂交分析和 Pull-down 分析(2006) 发现小鼠 Chd8(610528) 的 C 末端区域与 Ctcf 的锌指结构域相互作用。对人肝癌细胞系的染色质免疫沉淀分析显示,CHD8 存在于 CTCF 靶位点,例如 H19 的差异甲基化区域、β 珠蛋白的基因座控制区域以及 BRCA1(113705) 和 MYC 基因的启动子区域。免疫沉淀分析证明 HeLa 细胞中存在 CHD8 和 CTCF 的内源性复合物。通过 RNA 干扰敲除 HeLa 细胞中的 CHD8,消除了 H19 差异甲基化区域的 CTCF 依赖性绝缘子活性,导致母体染色体上印记的 IGF2 重新激活。 CHD8 的缺乏会影响 BRCA1 和 MYC 基因的 CTCF 结合位点周围的 CpG 甲基化和组蛋白乙酰化,这些结合位点邻近异染色质。石原等人(2006) 得出结论,CTCF-CHD8 在活性绝缘体位点的绝缘和表观遗传调控中发挥作用。

阿科波夫等人(2006)提出了一种方法,该方法允许通过基于绝缘体阻断增强子效应的简单正负选择来直接隔离绝缘体。该方法允许从高达 1 Mb 的基因组区域制备的基因组片段混合物中选择能够阻断增强子的片段。使用这种方法,分析了 1 Mb 人类基因组基因座,即 19q13.13 上的 FXYD5(606669)/COX7A1(123995) 基因座。发现所研究基因座内的基因 ATP4A(137216) 和 APLP1(104775) 两侧都有绝缘体。这两个基因的特征在于不同的组织特异性表达,其不同于周围基因的组织特异性。这些数据被认为与绝缘体将基因组 DNA 细分为环结构域的概念一致,这些环结构域包含具有相似表达谱特征的基因。 Akopov 等人使用染色质免疫沉淀测定(2006) 还证明,这项工作中揭示的至少 6 个假定的绝缘子可以在体内结合 CTCF 转录因子。他们相信所提出的方法可能成为基因组功能分析的有用工具。

X 染色体失活通过沉默雌性中的一个 X 来确保雄性和雌性哺乳动物中 X 染色体剂量的相等(Lyon,1961)。为了实现活动 X(Xa) 和非活动 X(Xi) 的互斥指定,该过程需要 2 个 X 通过同源配对进行反式通信。配对取决于基因 TSIX(300181) 和 XITE(300074) 内的 15 kb 区域。徐等人(2007) 通过转基因方法在小鼠细胞中剖析了分子要求,发现配对可以通过序列相似性很小的 Tsix 或 Xite 的 1 至 2 kb 亚片段来概括。然而,它们之间的一个共同点是蛋白质 Ctcf 的存在,这是一种染色质绝缘体,他们发现它对于配对至关重要。配对也取决于转录。转录抑制阻止了新配对的形成,但不会干扰现有配对。

温特等人(2008) 描述了人类基因组中的粘连蛋白结合位点,并表明其中大部分与 CTCF(一种转录绝缘所需的锌指蛋白)相关。 CTCF 对于将粘连蛋白加载到 DNA 上来说是可有可无的,但需要在特定结合位点富集粘连蛋白。粘连蛋白使 CTCF 能够将启动子与远处的增强子隔离,并控制 H19/IGF2 基因座的转录。粘连蛋白的这种作用似乎与其在内聚力中的作用无关。温特等人(2008) 提出粘连蛋白作为转录绝缘子发挥作用,并推测该功能的细微缺陷会导致“粘连病”。例如 Cornelia de Lange 综合征(参见 122470)。

马琼德等人(2008) 发现小干扰 RNA 介导的 CTCF 敲低(CTCF 与 XL9(HLA-DRB1(142857) 和 HLA-DQA1(146880) 之间的基因间元件)结合)降低了 DRB1 和 DQA1 的表达。免疫共沉淀实验表明 CTCF、CIITA(MHC2TA; 600005) 和 RFX5(601863) 位于同一复合物中,表明 XL9 与 DRB1 和 DQA1 近端启动子可能相互作用。染色质构象捕获(3C) 分析表明情况很可能如此,并且 3C 产物因 CTCF 的敲低而丢失。 RNA FISH分析显示DRB1和DQA1在某些细胞中同时表达。马琼德等人(2008) 得出结论,CTCF 相互作用代表了调节这些免疫系统主要组织相容性复合体基因的新机制。

海因茨曼等人(2009) 使用基于染色质免疫沉淀的微阵列方法(ChIP-chip) 来鉴定多种细胞类型中的启动子、增强子和绝缘子,并研究它们在细胞类型特异性基因表达中的作用。他们观察到,启动子处的染色质状态和绝缘子处的 CTCF 结合在不同细胞类型中基本上是不变的。相比之下,增强子以高度细胞类型特异性的组蛋白修饰模式为标志,与全球范围内的细胞类型特异性基因表达程序密切相关,并且以细胞类型特异性的方式发挥功能活性。海因茨曼等人(2009) 得出的结论是,他们的结果定义了人类基因组中超过 55,000 个潜在的转录增强子,显着扩展了当前的人类增强子目录,并强调了这些元件在细胞类型特异性基因表达中的作用。

哈朱尔等人(2009) 表明,粘连蛋白/CTCF 通过与一组选定的保守序列元件关联,在发育调节细胞因子基因座 IFNG(147570) 的顺式中形成了细胞类型特异性、长距离染色体相互作用的拓扑和机制基础。

多诺霍等人(2009) 证明 OCT4(164177) 位于 X 染色体失活(XCI) 层次结构的顶部,并通过触发 X 染色体配对和计数来调节 XCI。 OCT4 直接结合 X 失活中心的 2 个调节性非编码 RNA 基因 TSIX(300181) 和 XITE(300074),并通过蛋白质-蛋白质相互作用与 SCI 转因子 CTCF 和 YY1(600013) 复合。 Oct4 的缺失会阻断同源 X 染色体配对,并导致雌性小鼠胚胎干细胞中两条 X 染色体失活。多诺霍等人(2009) 得出的结论是,他们确定了第一个调节计数的反式因子,并在 X 染色体重编程过程中将新功能归因于 OCT4。

Kunarso 等人使用染色质免疫沉淀测序(ChIP-Seq)(2010) 表明,CTCF 结合的基因组区域在未分化的小鼠和人胚胎干细胞之间高度保守。然而,OCT4 和 NANOG(607937) 结合的区域几乎没有发现保守性。物种之间 OCT4 和 NANOG 结合的大部分差异似乎是由于转座元件的物种特异性插入,例如内源 ERV1 重复序列,它产生了独特的 OCT4 和 NANOG 重复序列相关的结合位点。

汉多科等人(2011) 对小鼠胚胎干细胞中与 Ctcf 相关的染色质组织进行了表征,并以高置信度鉴定了 1,480 个染色体内相互作用和 336 个染色体间相互作用。对组蛋白甲基化模式、RNA 聚合酶 II(参见 180660)或 p300 增强子(EP300;602700)的结合以及核纤层占据的检查揭示了 5 类染色体内环:具有活性特征的环、具有抑制特征的环、充当增强子和启动子活性、边界两侧具有相反染色质状态的环以及缺乏特定染色质模式的环。超过 200 kb 的循环更有可能与活跃特征相关,而小于 200 kb 的循环更有可能是沉默的。核纤层蛋白 B(LMNB1;150340) 相关环似乎充当绝缘体。 Ctcf 介导的环化还使许多基因的启动子与 p300 紧密接触(小于 10 kb)并增强了基因表达。

郭等人(2011) 在小鼠中报告了一个关键的免疫球蛋白重链(Igh;参见 147100) V(D)J 重组调节区,称为基因间控制区-1(IGCR1),位于 V(H) 和 D 簇之间。在功能上,IGCR1 使用 CTCF 环/绝缘子因子结合元件,并相应地介导包含远程增强子的 Igh 环。 IGCR1 通过抑制 D(H)-近端 V(H) 基因片段的转录和重排并促进远端 V(H) 片段的重排,促进正常 B 细胞发育并平衡抗体库。 IGCR1 通过抑制 V(H) 与不与 J(H) 片段连接的 D 片段连接来维持有序且谱系特异性的 V(H)(D)J(H) 重组,并且 V(H) 与 DJ(H) 连接分别是胸腺细胞。 IGCR1 也是反馈调节和近端 V(H) 至 DJ(H) 重组的等位基因排除所必需的。郭等人(2011) 得出的结论是,他们的研究阐明了长期寻找的 Igh V(D)J 重组控制区,并表明了普遍表达的 CTCF 蛋白的新作用。

舒克拉等人(2011) 提供的证据表明,CTCF 可以通过介导局部 RNA 聚合酶 II 在哺乳动物选择性剪接模型系统、CD45(151460) 和全基因组范围内暂停,从而促进弱上游外显子的包含。他们进一步表明,CTCF 与 CD45 外显子 5 的结合受到 DNA 甲基化的抑制,从而对外显子 5 包含产生相互影响。舒克拉等人(2011) 的结论是,他们的结果为通过可遗传的表观遗传标记对剪接结果的发育调控提供了机械基础。

索弗等人(2011) 发现 CTCF 通过上调 ATXN7 的非编码反义调节转录本 SCAANT1(ATXN7AS1; 614481) 的表达来下调 ATXN7(607640) 的表达。他们确定了 ATXN7(607640) 外显子 3 侧翼的 CTCF 结合位点,该位点包含翻译起始位点和扩展时导致脊髓小脑共济失调 7(SCA7; 164500) 的 CAG 束。索弗等人(2011) 生成了表达约 13.5 kb 人 ATXN7 小基因构建体的转基因小鼠,该构建体包含 SCAANT1,SCAANT1 是 ATXN7 内含子 2 3 引物末端的替代启动子(P2A),外显子 3 中的 ATXN7 翻译起始位点,是致病性 CAG 扩展外显子 3 以及外显子 3 侧翼的野生型或突变型 CTCF 结合位点。具有突变型 CTCF 结合位点的转基因小鼠(但不具有野生型 CTCF 结合位点的转基因小鼠)表现出 CTCF 结合减少、ATXN7 表达升高和 SCAANT1 表达降低,并且发育SCA7的特点。使用在原代小鼠小脑星形胶质细胞中转染的反义 ATXN7 构建体进行的报告基因分析表明,CTCF 结合是最大 SCAANT1 启动子活性所必需的,并且致病性 CAG 扩展降低了 SCAANT1 启动子活性。人视网膜母细胞瘤细胞中 CTCF 的敲低显着降低了 SCAANT1 的表达,并增加了 P2A 启动子(而非典型上游启动子)表达的 ATXN7 mRNA。

T 细胞受体(TCR)-α(TCRA;参见 186880)/TCR-δ(TCRD;参见 186810) 基因座包含 TCRA 和 TCRD 基因片段,它们在胸腺细胞发育过程中受到明显调节。 Shih 等人使用染色体构象捕获(2012) 证明 Tcra 增强子(E-α) 区域直接与 Cd4(186940) 阳性/Cd8(参见 186910) 阳性双中的 Tcra 可变(TRAV; 615442) 和连接(TRAJ; 615443) 基因片段相互作用。阳性(DP)小鼠胸腺细胞。 E-α 促进 Trav 和 Traj 片段之间的相互作用,促进它们的突触。 Ctcf 与 E-α 和许多 Tcra/Tcrd 位点启动子结合,使 E-α 偏向与这些启动子元件相互作用,并且是有效 Trav-Traj 重组所必需的。 DP 胸腺细胞中 Ctcf 的缺失导致这些元件之间的长距离相互作用失调,抑制染色质中心形成,并损害初始 Trav-Traj 重排。施等人(2012) 得出的结论是,E-α 和 CTCF 合作创建了一个发育调节的染色质中枢,支持 TRAV-TRAJ 突触和重组。

通过分析小鼠胚胎干细胞染色质免疫沉淀测序和微阵列分析的数据,Gokhman 等人(2013) 发现 Ctcf 抑制核心组蛋白的表达。

纳伦德拉等人(2015) 证明 CTCF 在胚胎干细胞分化为颈运动神经元期间隔离相邻但拮抗的染色质结构域。 Hox 簇内 CTCF 结合位点的删除会导致活性染色质扩展到抑制域。 CTCF 通过将 Hox 簇组织成空间不相交的域来发挥绝缘体的作用。 CTCF 结合的消除破坏了拓扑边界,使得尾部 Hox 基因离开抑制域并受到转录激活。因此,纳伦德拉等人(2015) 得出的结论是,CTCF 需要将兼性异染色质与常染色质的碰撞隔离开来,以产生离散的位置特性。

布斯林格等人(2017) 证明粘连蛋白在小鼠基因组中的分布取决于转录、Ctcf 和粘连蛋白释放因子 Wings Apart-like(WAPL; 610754)。在 Ctcf 耗尽的成纤维细胞中,粘连蛋白不能正确地募集到 Ctcf 位点,而是在活性基因的转录起始位点积累,即粘连蛋白负载复合物所在的位置。在 Ctcf 和 Wapl 均不存在的情况下,粘连蛋白会在活性基因 3 素末端的长达 70 kb 的区域中积累,特别是当这些基因彼此聚合时。改变基因表达可以调节这些“粘连蛋白岛”的位置。这些发现表明,转录可以在 DNA 上长距离重新定位哺乳动物粘连蛋白,正如酵母粘连蛋白所报道的那样,这种易位有助于将粘连蛋白定位在 CTCF 位点,并且活性基因可以通过转录介导的易位或通过 WAPL 从粘连蛋白中释放出来-介导的释放。

陈等人(2019) 报道称,与小鼠精子不同,人类精子细胞不表达染色质调节因子 CTCF,并且其染色质不包含拓扑关联结构域(TAD)。人类受精后,TAD 结构在胚胎发育过程中逐渐建立。此外,A/B 区室化在人类胚胎的 2 细胞阶段消失,并在胚胎发生过程中重新建立。值得注意的是,阻断合子基因组激活可以抑制人类胚胎中 TAD 的建立,但不能抑制小鼠或果蝇中的 TAD 建立。值得注意的是,CTCF 在合子基因组激活之前以非常低的水平表达,然后在观察到 TAD 的合子基因组激活阶段高表达。 CTCF 敲除胚胎中 TAD 组织显着减少,表明人类胚胎合子基因组激活期间 TAD 的建立需要 CTCF 表达。陈等人(2019) 的结论是,他们的结果表明 CTCF 在人类胚胎发生过程中 3D 染色质结构的建立中发挥着关键作用。

为了阐明 CTCF 在蜂窝状态转变和细胞增殖中的作用,Stik 等人(2020) 研究了 CTCF 消耗在人类白血病 B 细胞转化为具有最小细胞分裂的巨噬细胞过程中的影响。 CTCF 耗尽会破坏 TAD 组织,但不会破坏细胞转分化。相比之下,诱导巨噬细胞中 CTCF 的消耗会损害暴露于内毒素后炎症基因的全面上调。斯蒂克等人(2020) 得出的结论是,CTCF 依赖性基因组拓扑结构并不是功能性细胞命运转换的严格要求,但有助于对外部刺激做出快速有效的反应。

巴等人(2020) 测试了线性 RAG(参见 179615)扫描在 G1 期停滞的 v-Abl pro-B 细胞系中介导远端 V(H) 使用的潜力,这些细胞系经历了强大的 D-to-J(H) 但很少有 V( H)-to-DJ(H)重排,可能是由于缺乏基因座收缩。通过生长素诱导方法,Ba 等人(2020) 降解了这些 G1 停滞株系中的粘连蛋白成分 RAD21(606462) 或 CTCF。 RAD21 的降解消除了所有 V(D)J 重组和与 RAG 扫描相关的相互作用,但位于重组中心的 DQ52-to-J(H) 连接除外,其中突触通过扩散发生。值得注意的是,虽然 CTCF 的降解抑制了大多数基于 CTCF 循环因子结合元件(CBE) 的染色质相互作用,但它促进了与远端 V(H) 的稳健重组中心相互作用,以及稳健的 V(H) 与 DJ(H) 连接。 ),其模式与位点收缩的原代 B 细胞相似。因此,Ba 等人(2020) 得出的结论是,下调 CTCF 结合的扫描障碍活性可促进跨 2.7 Mb Igh 基因座的粘连蛋白驱动的 RAG 扫描。

▼ 分子遗传学

Gregor 等人在 3 名患有不同严重程度的智力障碍、头围和/或身高低于正常范围或低于 -2 标准差以及喂养困难的男孩中(MRD21; 615502)(2013) 鉴定了 CTCF 基因的从头突变(604167.0001-604167.0003)。对 3 名患者的淋巴细胞 RNA 进行全转录组测序,结果显示患者和对照组之间的基因表达存在差异,其中涉及信号转导的基因失调;与具有错义突变的受影响更严重的患者相比,这两名具有移码突变的患者的基因表达模式彼此更加相似,而错义突变的患者的基因表达模式更加不同。在对 Decipher 数据库的搜索中,Gregor 等人(2013) 还发现一名患有智力障碍的女孩在 16 号染色体上发生了涉及 CTCF 和其他 7 个基因的从头缺失。

Konrad 等人在 39 名 MRD21 个体中进行了研究(2019) 鉴定了涉及 CTCF 基因的突变,包括包含 CTCF 和邻近基因的 2 个大缺失,以及 CTCF 中的 8 个可能的基因破坏性突变(2 个移码和 6 个无义突变)、2 个剪接位点和 20 个错义突变。家族性病例2例,父母一方或双方未能参加检测的病例6例;其余病例均显示为新发病例。所有错义变体均涉及位于编码 11 个锌指之一的外显子中的高度保守残基。在错义变体中,7个氨基酸残基反复受到影响(R342、R368、H373、R377、P378、R448、R567)。没有发现基因型/表型相关性。对 2 名可能具有基因破坏性变异的个体的血细胞进行 RNA 测序,结果显示 CTCF 表达同样降低,与健康对照相比,3 名具有错义变异的个体中至少有 2 名 CTCF 水平仅轻度降低。作者发现,与对照组相比,受影响者的 3,800 多个基因存在差异基因表达(有时是上调,更多时候是下调),其中与神经发育障碍相关的基因有所富集。具有可能的基因破坏性变异和错义变异的个体之间的差异表达基因存在显着重叠。

▼ 等位基因变异体(3 个选定示例):

.0001 智力发育障碍,常染色体显性遗传 21
CTCF、1-BP DUP、375T

Gregor 等人对一名患有轻度智力障碍、身材矮小、小头畸形、腭裂和先天性心脏缺陷(MRD21; 615502) 的 9.5 岁男孩进行了研究(2013) 在 CTCF 基因的外显子 3 中发现了一个从头杂合的 1-bp 重复(c.375dupT),预计会引起移码,从而导致提前终止密码子(Val126CysfsTer14)。对患者淋巴细胞的分析显示 CTCF 表达减少;测序证实突变等位基因几乎完全不存在,这与功能丧失或单倍体不足相一致。在父母、dbSNP、1000 基因组计划或外显子组变异服务器数据库、超过 1,500 个内部外显子组或 820 个健康对照中均未发现重复。患者的心脏缺陷包括房间隔缺损、动脉导管未闭和轻度主动脉缩窄。

.0002 智力发育障碍,常染色体显性遗传 21
CTCF、1-BP DUP、1186A

Gregor 等人在一名患有边缘智力、小头畸形、发育迟缓、明显学习困难和行为问题的 9 岁男孩中(MRD21; 615502)(2013) 在 CTCF 基因的外显子 6 中发现了一个从头 1-bp 重复(c.1186dupA),预计会导致移码,从而导致提前终止密码子。对患者淋巴细胞的分析显示 CTCF 表达减少;测序证实突变等位基因几乎完全不存在,这与功能丧失或单倍体不足相一致。在父母、dbSNP、1000 基因组计划或外显子组变异服务器数据库、超过 1,500 个内部外显子组或 820 个健康对照中均未发现重复。

.0003 智力发育障碍,常染色体显性遗传 21
CTCF、ARG567TRP

Gregor 等人在一名患有严重智力障碍、患有自闭症、小头畸形和严重喂养困难的 4 岁男孩中(MRD21; 615502)(2013) 在 CTCF 基因的外显子 9 的剪接供体共有位点中鉴定出从头 c.1699C-T 转变(c.1699C-T,NM_006565.3),导致 arg567 至 trp(R567W) 取代。在父母、dbSNP、1000 基因组计划或外显子组变异服务器数据库、超过 1,500 个内部外显子组或 820 个健康对照中均未发现该突变。在同一等位基因的同一外显子中检测到第二个从头同义变异 1650C-T;计算机分析显示没有剪接改变的证据,对患者淋巴细胞的分析显示 CTCF 表达水平与对照相似。

Tags: none