RNA,U1A 小核; RNU1A

snRNA、U1A
RNA、U1 小核;RNU1

HGNC 批准的基因符号:RNU1-4

细胞遗传学定位:1p36.13 基因组坐标(GRCh38):1:16,740,516-16,740,679(来自 NCBI)

▼ 说明

小核 RNA(snRNA) 的大小范围为约 80 至 350 个核苷酸,是真核细胞中普遍存在的成分。snRNA U(富含尿苷)家族被认为对 RNA 剪接很重要,并且在进化中高度保守。它们与特定的多肽结合,形成小核核糖核蛋白复合物(snRNP)。这些通常是自身免疫性疾病系统性红斑狼疮的目标。与 U1 snRNA 相关的多肽似乎是独特的(Wooley 等人,1983)。

▼ 克隆与表达

人类 U1、U2、U3、U4 和 U6 snRNA 的多基因家族已得到证实。U1-U5 RNA 的转录是由 RNA 聚合酶 II 完成的,而 U6 snRNA 被认为是由 RNA 聚合酶 III 转录的。Kunkel 和 Pederson(1988) 研究了人类 U6 RNA 基因的上游调控元件,发现尽管由不同的聚合酶转录,但与 U1 和 U2 snRNA 基因的近端控制元件有显着的相似性。与这些 snRNA 互补的人类基因大多数是假基因,分散在基因组中。尽管大多数 U1 基因位于染色体 1 上,但它们被认为是被大于 15 kb 的基因间间隔区域分隔开的,因为没有一个分离的重组噬菌体含有超过一个 U1 基因。相比之下,U2 snRNA 基因被组织为近乎完美的串联阵列,每个单倍体基因组有 10 至 20 个拷贝(Van Arsdell 和 Weiner,1984)。

▼ 测绘

博斯托克等人。Naylor 等人(1984) 得出结论,人类 U1 snRNA 的基因聚集在染色体 1 的短臂上。通过体细胞杂交研究,Naylor 等人(1984) 发现 RNU1 与染色体 1 标记 PEPC(170000) 和 AK2(103020) 分离。通过原位杂交,他们表明大部分颗粒集中在1p36.3带上。通过原位杂交,Lindgren 等人(1985) 发现 U1 snRNA 假基因(称为 I 类)在 1q12-q22 的簇中编码,与 1p36 中的真实基因(约 30 个拷贝)分开。

▼ 基因功能

阿尔马达等人(2013) 在小鼠胚胎干细胞中表明,基因转录起始位点侧翼的不对称序列决定簇通过调节启动子近端切割和多聚腺苷酸化来控制启动子方向性。阿尔马达等人(2013)发现上游反义RNA在起始后不久在poly(A)位点(PAS)处被切割和聚腺苷酸化。从头基序分析显示,相对于上游反义方向,PAS 信号和 U1 小核核糖核蛋白(U1 snRNP) 识别位点在有义方向上分别是最耗尽和最富集的序列。在脊椎动物进化过程中,这些 U1 snRNP 位点和 PAS 位点分别在编码基因的 5-prime 末端逐渐获得和丢失。U1 snRNP 活性的功能破坏导致有义方向上启动子近端切割事件的急剧增加,而反义方向上的轻微增加。阿尔马达等人(2013) 得出的结论是,他们的数据表明,以低 U1 snRNP 识别和上游反义区域中高密度的 PAS 为特征的 U1-PAS 轴通过促进上游反义区域的早期终止来增强启动子方向性,而近端有义 PAS 信号受到抑制通过 U1 snRNP。阿尔马达等人(2013) 提出 U1-PAS 轴限制了基因组中的普遍转录。

铃木等人(2019) 报告称,在 Sonic Hedgehog 体细胞突变引起的髓母细胞瘤中,约 50%(109 例中的 56 例)存在 U1 snRNA 的高度复发性热点突变(r.3A-G)(SHH;600725)。这些突变不存在于髓母细胞瘤的其他亚组中,Suzuki 等人(2019) 在 2,442 种癌症(包括 36 种其他肿瘤类型)中,仅在 1 种中发现了 U1 snRNA r.3A-G 突变。这些突变发生在 97% 的 SHH 髓母细胞瘤成人(SHH-δ 亚型)和 25% 的青少年(SHH-α 亚型)SHH 髓母细胞瘤中,但婴儿 SHH 髓母细胞瘤中基本上不存在这种突变。U1 snRNA突变发生在5-prime剪接位点结合区域,并且snRNA突变肿瘤显着破坏了RNA剪接和过量的5-prime隐性剪接事件。由突变体 U1 snRNA 介导的选择性剪接使肿瘤抑制基因 PTCH1(601309) 失活并激活癌基因 GLI2(165230) 和 CCND2(123833)。

帅等人(2019) 报道了几种类型肿瘤中 U1 snRNA 的第三个碱基(g.3A-C) 高度复发的 A 到 C 体细胞突变。U1 snRNA 的主要功能是通过碱基配对识别 5 素剪接位点。这种突变将 U1 snRNA 和 5-prime 剪接位点之间的优先 AU 碱基配对更改为 CG 碱基配对,从而创建新的剪接连接并改变多个基因的剪接模式,包括已知的癌症驱动因素。临床上,A-to-C 突变与肝细胞癌(114550) 患者的大量饮酒有关,并且与免疫球蛋白重链可变区未突变的慢性淋巴细胞白血病(CLL; 151400) 的侵袭性亚型有关(参见 147070)。U1 snRNA 的突变也孤立地给慢性淋巴细胞白血病患者带来不良预后。

Yin 等人在小鼠和人类细胞中使用了一种随机、诱变耦合、高通量的方法,称为“通过测序进行亚细胞定位的 RNA 元件”(mutREL-seq)(2020) 鉴定了一个可识别 U1 snRNP 的 RNA 基序,并且对于报告 RNA 定位到染色质至关重要。在整个基因组中,染色质结合的长非编码 RNA(lncRNA) 富含 5-prime 剪接位点并耗尽 3-prime 剪接位点,并且与细胞质定位的 mRNA 相比,表现出高水平的 U1 snRNA 结合。急性消耗 U1 snRNA 或 U1 snRNP 成分 SNRNP70(180740) 可显着减少数百个 lncRNA 和不稳定转录物的染色质关联,而不会改变细胞中的总体转录率。SNRNP70 的快速降解减少了新生和多腺苷酸化 lncRNA 转录本在染色质上的定位,并破坏了 lncRNA Malat1 的核和全基因组定位(607924)。此外,U1 snRNP 与转录参与的 RNA 聚合酶 II 相互作用(参见 180660)。作者得出结论,U1 snRNP 广泛发挥作用,以转录依赖性方式将 lncRNA 束缚和动员到染色质。

▼ 进化

伯恩斯坦等人(1985) 提出的证据支持这样的观点,即真正的 U1 基因是通过基因扩增和转座衍生自更古老的 U1 基因家族(现在以 I 类 U1 假基因为代表)。U1 真基因和假基因的聚集以及 30 个真 U1 基因中大部分 U1 编码区侧翼至少 44 kb DNA 的保守性可以通过基因扩增来解释。

U1 snRNA 的假基因数量是真实基因的 15 至 30 倍。一些假基因与真基因没有侧翼同源性,但其他假基因(I 类假基因)具有数千碱基的侧翼同源性。林格伦等人(1985)指出U1假基因的位点对应于腺病毒12的染色体修饰位点。他们推测 I 类 U2 假基因可能会受到病毒的影响,因为它们保留了侧翼调控序列。

Tags: none