泛素特异性蛋白酶 6; USP6
TRE2癌基因;TRE2
HGNC 批准的基因符号:USP6
细胞遗传学定位:17p13.2 基因组坐标(GRCh38):17:5,116,032-5,174,991(来自 NCBI)
▼ 克隆与表达
TRE 基因座首先从转染人尤文肉瘤 DNA 的 NIH 3T3 细胞中分离出来(Nakamura 等,1988)。休布纳等人。Nakamura 等人(1988) 发现,该基因座在人类细胞中是不连续的,由来自人类第 5、18 和 17 号染色体的 5 素数至 3 素数的 3 个主要遗传元件组成(1992) 从 TRE 转染的 NIH 3T3 肿瘤细胞的细胞质聚(A) RNA 的 cDNA 文库克隆了 TRE 染色体 17 部分的转录本。他们获得了一种新的cDNA,其5-prime部分与TRE转录物重叠,并将其起源基因座命名为TRE2。完整的 cDNA 跨度为 8,201 bp,拥有一个异常长的非编码区和一个包含 2 个开放阅读码组(ORF) 的翻译区。在 1 个 cDNA 克隆中,存在 2 个插入序列表明存在选择性剪接的可能性。使用亚克隆到表达载体中的 ORF 进行的转染致瘤性测定对于邻近 5-prime 非编码区的 ORF 呈阳性,而对于第二个下游 ORF 呈阴性。对从 5 素 ORF 推导的 786 个氨基酸序列进行分析,预测出一种具有 2 个电荷簇的高度亲水性蛋白质,表明其具有核酸结合特性。当用作探针时,克隆序列在多种人类癌细胞中检测到了 RNA 转录本,无论它们来自不同组织的谱系如何,但在正常组织的人类细胞中却没有检测到 RNA 转录本。
基因复制和结构域增加被认为是进化过程中新基因出现的主要机制。基因组序列分析证明了高等灵长类动物进化过程中存在广泛的扩增事件。保尔丁等人(2003) 报道 USP6 癌基因源自 2 个基因 USP32(607740) 和 TBC1D3(607741) 的嵌合融合。USP32 是一种古老的高度保守基因,而 TBC1D3 源自最近的片段复制,这种复制在大多数其他哺乳动物中都不存在,并且在灵长类谱系中表现出快速扩增和扩散。嵌合基因USP6只存在于灵长类人科动物谱系中,并且在灵长类动物谱系中TBC1D3节段复制增殖之后才在21至3300万年前出现。保尔丁等人(2003) 确定全长 USP6 基因编码 1,406 个氨基酸的蛋白质。氨基酸 1 至 496 衍生自 TBC1D3 并且包含 TBC 结构域。氨基酸 501 至 1406 源自 USP32,包含泛素特异性蛋白酶结构域。与 USP32 和 TBC1D3 的广泛表达模式相反,RT-PCR 分析表明 USP6 的表达是睾丸特异性的,这是一种与生殖障碍出现有关的基因的模式。作者得出的结论是,嵌合蛋白(例如 USP6 编码的蛋白)的突然出现可能有助于类人猿物种形成。
▼ 基因结构
通过基因组序列分析,Paulding 等人(2003) 确定 USP6 基因包含 30 个外显子,跨度至少 47 kb。外显子1至14源自TBC1D3亲本基因,外显子15至30源自USP32亲本基因。
▼ 测绘
通过染色体原位杂交,Nakamura 等人(1992) 将 TRE2 基因定位到 17q11。然而,通过基因组序列分析,Paulding 等人(2003) 将 USP6 基因对应到染色体 17p13。