IV 型胶原蛋白,α-6; COL4A6
基底膜胶原蛋白,α-6
HGNC 批准的基因符号:COL4A6
细胞遗传学位置:Xq22.3 基因组坐标(GRCh38):X:108,155,614-108,439,458(来自 NCBI)
▼ 说明
COL4A6 基因编码 IV 型胶原蛋白 α-6 亚型,它是基底膜的一个组成部分。基底膜分隔组织并为其支持的细胞的分化提供重要信号。 IV型胶原蛋白是基底膜的主要成分,是由3条α链组成的三螺旋分子。 α-1(COL4A1; 120130) 和 α-2(COL4A2; 120090) 链普遍存在,而 α-3(COL4A3; 120070)、α-4(COL4A4; 120131) 和 α-5(COL4A5; 303630)链的组织分布受到限制。根据序列相似性,链分为 2 类:α-1、α-3 和 α-5 组成类 α-1 类,α-2、α-4 和 α-6 组成类α-2类。 COL4A1 和 COL4A2 基因位于染色体 13 上的头对头配置中,COL4A3 和 COL4A4 基因在染色体 2 上的排列类似。因此,IV 型胶原蛋白似乎是通过祖先 α 链基因的复制进化而来的。 ,产生一对 5 素末端紧密相连的 α 链基因(Oohashi 等,1994;Zhou 等,1994)。
▼ 克隆与表达
Oohashi 等人通过对 cDNA 的分析(1994) 推导出 IV 型胶原蛋白 α-6 链的一级结构。推导的多肽含有1,678个氨基酸残基,包括21个残基的信号肽、24个残基的氨基末端非胶原结构域、一个1,405个残基的中央胶原结构域和一个228个残基的羧基末端非胶原结构域。
周等人(1994) 描述了完整的人类 COL4A6 cDNA,并表明该基因编码经典的 IV 型胶原蛋白,其整个长度与其他 5 条链具有同源性。有一个 21 个残基的信号肽、一个 1,417 个残基的胶原结构域(注意与 Oohashi 等人,1994 年给出的长度不同),在 25 个点处中断,以及一个 228 个残基的羧基末端非胶原结构域。其结构与COL4A2和COL4A4最相似。周等人(1994) 推导出 6 条链的演化,从而对 IV 型胶原蛋白家族进行了新的分类。
杉本等人(1994)描述了COL4A5和COL4A6的5素侧翼序列。对转录起始位点上游序列的分析揭示了管家基因的特征,即缺乏 TATA 基序以及 CCAAT 和 CTC 框的存在。此外,COL4A6 基因被发现含有 2 个替代启动子,控制 2 个不同转录本的生成。一个转录起始位点(来自外显子 1-prime)距离 COL4A5 的转录起始位点 442 bp,而另一个转录起始位点(来自外显子 1)距离第一个转录起始位点 1,050 bp,驱动第二个转录本的表达编码具有不同信号肽的 α-6(IV) 链。逆转录 PCR 实验表明,外显子 1-prime 的转录物在胎盘中丰富,而外显子 1 的转录物在肾脏和肺中更常见。这些结果为在不同组织中生成独特基底膜结构的机制提供了额外的线索。
通过免疫组织化学染色,Rost 等人(2014)发现Col4a6基因在小鼠内耳中表达,在螺旋韧带血管纹的膜和骨结构以及神经节细胞亚群中最为明显。斑马鱼胚胎在神经系统和耳朵(尤其是耳囊)中显示出 Col4a6 的动态表达。
▼ 基因结构
大桥等人(1995) 确定人类 COL4A6 基因跨度超过 200 kb,包含 46 个外显子。外显子 1-prime 和 1 编码两个不同的 5-prime UTR 和信号肽的 2 个氨基末端部分。大桥等人(1995) 在 COL4A6 中鉴定出 3 个 CA 重复标记,可用于等位基因检测、连锁分析和由该基因突变引起的疾病的家族诊断。
张等人(1996) 描述了 COL4A6 基因的完整外显子/内含子大小模式,该基因跨度约为 425 kb。他们研究了该基因的 85 kb 和 25 kb 侧翼序列,包括该基因的所有 46 个外显子和除内含子 2 之外的所有内含子。据推测,内含子 2 的大小约为 340 kb。他们发现COL4A6的外显子大小模式与人类和小鼠COL4A2基因的外显子大小模式高度同源,COL4A6的46个外显子中有27个基因之间的大小相同。
▼ 测绘
大桥等人(1994)通过原位杂交将COL4A6基因定位到染色体Xq22。
周等人(1993) 预测 COL4A5 基因可能与 α-2 样基因配对;事实上,他们证明了情况确实如此,证明 COL4A6 基因以头对头的方式位于 X 染色体上,并且位于 COL4A5 基因(303630) 的 452 bp 内。
▼ 分子遗传学
Rost 等人在患有先天性 X染色体连锁耳聋 6(DFNX6; 300914) 的匈牙利家庭的 4 名受影响男性成员中(2014) 鉴定出 COL4A6 基因中的半合子突变(G591S; 303631.0002)。 5 名女性杂合突变携带者出现轻度听力损失,1 名女性突变携带者在 46 岁时未受影响。该突变是通过 X 染色体的外显子组测序发现的。对另外 96 名听力损失患者的 COL4A6 基因进行测序,未发现任何突变。
O'Brien 等人通过对 187 个基因听力损失组进行下一代测序(2022) 确定了 2 个家庭,其中成员患有先天性耳聋和 COL4A6 基因变异。在 A 家族中,先证者对于外显子 15(c.951+1G-T) 的母系遗传供体剪接位点变异是半合子。剪接分析显示,由于引入了早期终止密码子,外显子 15 发生了跳跃,表明该变异可能具有致病性。该变体在 gnomAD 中的次要等位基因频率为 0.00001。然而,先证者还从其受影响的父亲那里继承了 GJB2 基因(R75W;121011.0011)的致病性杂合突变。作者假设 COL4A6 和 GJB2 变异都导致先证者的听力损失比其父母的听力损失更严重,但没有听力数据来证明这一假设。在墨西哥一家听力诊所查明的 B 家庭中,有 4 名家庭成员患有语前发病的重度至极重度听力损失。在先证者(B-III-1)中,没有发现致病突变。然而,作者在先证者的父亲、叔叔和祖母中发现了 COL4A6 基因(G1091A;303631.0003)的错义突变,该突变破坏了 Gly-X-Y 基序。根据 gnomAD(0.001075),该变异在拉丁裔人群中很少见。根据ACMG标准,该变体被归类为意义不确定的变体。
▼ 细胞遗传学
Alport 综合征(ATS; 301050) 的 X 染色体连锁形式是由 COL4A5 基因(303630) 突变引起的。周等人(1993) 发现当 COL4A5 的缺失延伸到邻近的 COL4A6 基因时,ATS 可能伴有食管弥漫性平滑肌瘤病(DL)(ATS-DL; 308940)。这是“邻近基因综合症”的一个明显例子。周等人(1993) 得出结论,COL4A6 基因及其产物对于正常平滑肌分化至关重要。尽管作者认为一些孤立性 Alport 综合征患者也可能有 COL4A6 突变,但大量 ATS 患者的 Southern 印迹分析排除了异常模式。
▼ 基因型/表型相关性
海德特等人(1995)表明,在 7 名弥漫性平滑肌瘤病/Alport 综合征患者中观察到的 COL4A5 和 COL4A6 基因缺失仅包含 COL4A6 的前 2 个外显子,断点位于 COL4A6 的第二个内含子,其大小超过 65 kb。三名患有 ATS 且无平滑肌瘤病且 COL4A5 基因 5-prime 部分缺失的患者表现出较大的 COL4A6 缺失。此外,通过 RT-PCR 在患有弥漫性平滑肌瘤病/阿尔波特综合症患者的食管肿瘤样本中检测到了 COL4A6 mRNA 产物。这些结果表明邻近基因综合征是由异常截短的 α-6(IV) 链引起的。
更大的基因损伤完全消除了仅与 ATS 一起存在的两种胶原蛋白基因。 COL4A6 的一个关键区域,包括其第三个内含子的一些区域,需要避免平滑肌瘤病的发生。有人提出,这个内含子含有第三个尚未鉴定的抑制 DL 基因的结构或调控元件;或者,COL4A6 的截短形式可能直接影响平滑肌细胞的生长。植木等人(1998) 研究了一名 19 岁男孩,该男孩在 6 岁时被发现有血尿,并伴有与阿尔波特综合征相符的肾活检结果。 8岁时,他出现食管功能障碍,接受了食管胃切除术。对 COL4A6/COL4A5 区域的研究表明,从 COL4A6 内含子 3 的第三个 PstI 位点的 3 引物延伸到 COL4A5 内含子 1 的 BamHI 位点紧邻的 5 引物,存在 17 kb 的缺失。由于 2 个基因是头对头定向的,因此删除消除了 COL4A5 的第一个编码外显子和 COL4A6 的前 2 个编码外显子。植木等人(1998) 发现断点共享相同的序列,而该序列又与拓扑异构酶 I(TOP1; 126420) 和 II(TOP2; 126430) 的共有序列密切同源。额外的 DNA 证据表明,该患者是该突变的体细胞嵌合体。使用 α 链特异性单克隆抗体进行的免疫组织化学分析支持了这一结论,因为它揭示了平滑肌细胞肿瘤的大多数(但不是全部)基底膜中不存在 IV 型胶原蛋白的 α-5 和 α-6 链。他们还在患者肾脏的肾小球基底膜中记录了类似的节段染色模式。断点周围拓扑异构酶的多个共有序列的存在可能暗示了 COL4A5/COL4A6 区域体细胞缺失的机制,但短 COL4A6 缺失和长 COL4A6 缺失之间表型差异的原因仍然未知。
▼ 等位基因变异体(3 个精选示例):
.0001 已从数据库中删除
.0002 耳聋,X染色体连锁6(1个家族)
COL4A6、GLY591SER
Rost 等人在患有 X染色体连锁耳聋 6(DFNX6; 300914) 的匈牙利家庭的 4 名受影响男性成员中(2014) 在 COL4A6 基因的外显子 23 中发现了一个半合子 c.1771G-A 转换,导致高度保守的残基处发生 gly591 到 Ser(G591S) 的取代。该突变是通过 X 染色体外显子组测序发现的,并通过桑格测序证实,与家族中的疾病分离。它不存在于 407 个种族匹配的对照或公共 SNP 数据库中。 4 名女性杂合突变携带者随着年龄的增长出现轻度听力损失,1 名女性携带者在 9 岁时出现轻度听力损失,另一名女性携带者在 46 岁时未受影响。突变携带者均未出现肾脏或眼部异常。三螺旋结构内高度保守的甘氨酸残基上的 G591S 取代位置预计会破坏整个胶原蛋白分子的稳定性。没有对该变体进行功能研究。
.0003 意义未知的变体
COL4A6、GLY1091ALA
该变体被归类为意义不明的变体,因为它是按照 ACMG 标准分类的。此外,O&Brien 等人报告的 4 名患有非综合征性听力损失的家庭成员中(2022),仅在 3 名成员中发现了该变异;先证者中没有发现致病变异。
奥布莱恩等人(2022) 报道了一个家庭(家庭 B),其中 4 名成员患有严重至极重度的语前发病的非综合征性听力损失。先证者(III:1) 中未发现致病突变,但其受影响的父亲(II:3)、叔叔(II:2) 和祖母(I:2) 被发现有 c.3272G-C COL4A6 基因中的转变(c.3272G-C,NM_001287758.1),导致 gly1091 到 ala(G1091A) 取代,从而破坏 Gly-X-Y 基序。在 gnomAD 数据库中,该变异在拉丁裔人群中很少见(MAF 为 0.001075)。没有功能研究的报道。