基于生物信息学筛选与分析胰腺癌的生物标志物半胱氨酸蛋白酶抑制剂S①

董经茹 白云鹤 何 京 赵红峥 张金艳 (河北医科大学第四医院检验科,石家庄 050011)

胰腺癌(pancreatic adenocarcinoma,PAAD)是一种高度致命的恶性肿瘤,近年来在世界范围内的发病率和病死率都在提高,其高病死率归因于PAAD生物学、早期诊断困难以及在评估可疑胰腺肿块方面缺乏标准化的国际指南[1-2]。及时准确地诊断PAAD可以改善其不良预后,但目前PAAD的诊治现状依然严峻,大多数患者起病隐匿且早期症状不典型在诊断时已为晚期或转移性疾病,因此PAAD关键基因对诊断、治疗及提示预后具有重大价值[3]。

半胱氨酸蛋白酶抑制剂(cysteine protease inhibitor,CSTs)通过与半胱氨酸蛋白酶相结合,抑制蛋白酶发生水解反应,其表达的变化影响肿瘤发展的各个阶段,包括肿瘤的生长、凋亡以及侵袭、转移和血管生成[4]。CSTs主要分为3个亚型:Ⅰ型为Stefins,结构最简单,主要是无二硫键的细胞内非糖基化多肽,包括Stefin A(CSTA)和Stefin B(CSTB);
Ⅱ型为胱抑素,与Stefins不同的是其包含2个保守的二硫键和1个信号序列,使它们能够分泌到细胞外,主要成员有SN(CST1)、SA(CST2)、C (CST3)、S(CST4)、D(CST5)、E/M(CST6)和 F(CST7)等;
Ⅲ型为激肽原,是大型多功能血浆蛋白,包含3个Ⅱ型胱抑素样结构域[5]。半胱氨酸蛋白酶抑制剂 S(Cystatin S,CST4)又称唾液酸性蛋白1,是Ⅱ型半胱氨酸蛋白酶抑制剂超家族成员,是由141个氨基酸残基组成的分泌型蛋白,包含2个特殊的二硫键。研究表明,CST4 mRNA和蛋白在胃肠道肿瘤组织和细胞系中表达上调,CST4通过调节ELFN2信号增强胃癌的侵袭力[6-7]。CST4在胃肠道肿瘤的诊断及预后中提供了重要信息,但在PAAD中的意义尚不清楚。因此,本研究应用生物信息学的方法,综合分析CST4在PAAD中的表达情况,为临床中PAAD的诊断、治疗及预后评估提供新的方向。

1.1 数据获取与预处理 基因表达汇编(GEO)数据库(https://www.ncbi.nlm.nih.gov/geo/info/)是由国家生物技术信息中心(NCBI)建立和维护的国际公共存储库,用于存放研究界提交的高通量微阵列和下一代序列功能基因组数据集。GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)是一种基于R的在线分析工具,可帮助用户分析GEO数据,识别和可视化差异表达基因(DEGs)[8]。本研究选取GEO数据库中GSE15471和GSE16515基因表达芯片数据集为研究对象。利用GEO2R比较PAAD及癌旁正常组织的基因表达差异,以P<0.05且|log2FC|>1为DEGs的筛选标准。

1.2 CST4 mRNA在泛癌中的表达情况 GEDS(http://bioinfo.life.hust.edu.cn/web/GEDS/)是一个用于搜索和可视化mRNA、miRNA和蛋白质的基因表达数据的综合资源,可在癌症类型、正常组织和细胞系中显示用户输入的人类基因表达[9]。在GEDS的mRNA面板输入CST4,以箱式图的形式显示其在癌症基因组图谱(TCGA)和肿瘤细胞系CCLE数据库的表达情况。

1.3 CST4在消化系统肿瘤中的表达分析 TCGA数据库中某些肿瘤正常对照组织量较少,应用GEPIA2(http://gepia2.cancer-pku.cn/)匹配TCGA和基因型-组织表达(GTEx)数据库后进一步分析,获得CST4基因在消化系统肿瘤组织与相应正常组织之间表达差异的箱式图,以P<0.05作为显著性标准。

1.4 CST4生存预后分析 Kaplan-Meier plotter(https://kmplot.com/analysis/)是一款在线预后分析网站,常规在线提供了包括GEO、EGA和TCGA肿瘤特定基因的分组生存分析以及RNA测序和miRNA的表达基因的生存分析[10]。利用Kaplan-Meier Plotter数据分析平台绘制TCGA数据库中177例PAAD患者CST4 mRNA表达的生存曲线,限定条件分别为总生存期(overall survival,OS)和无复发生存时间(relapse free survival,RFS),生存时间统计最长为60个月。肿瘤病理类型、分期及患者性别等其他条件不做限制,从而评估CST4 mRNA表达与PAAD患者五年总生存率及无复发生存率的关系,结果以P<0.05作为显著性标准。

1.5 CST4与肿瘤细胞免疫浸润分析的关系 肿瘤浸润性免疫细胞作为肿瘤微环境的重要组成部分,与癌症的发生、发展或转移密切相关。免疫浸润分析数据库 TIMER2(http://timer.cistrome.org/)是用于系统分析各种癌症类型的免疫细胞浸润情况的综合资源[11]。利用TIMER2数据库的“Gene”模块,分析PAAD患者CST4表达量与多种免疫细胞浸润情况的相关性。通过TIMER、CiberSort、CiberSort-ABS、QuanTIseq、XCell、MCP-COUNTER 和 EPIC 算法进行免疫浸润评估,经纯度调整的Spearman等级相关检验得到P值和Rho值。数据以热图和散点图的形式可视化,结果以P<0.05作为显著性标准。

1.6 构建CST4蛋白相互作用网络及富集分析 蛋白质功能的完整描述需要了解与之特异性结合的所有伴侣蛋白质,功能蛋白互作网络(STRING,https://string-db.org/)是包含已知和预测的蛋白质相互作用的数据库,包括从基因组分析、高通量试验及共表达研究中获得的物理和功能的关联[12]。在STRING数据库的“Protein by name”模块输入CST4,选择物种“Homo sapiens”,获得CST4蛋白相互作用网络及GO功能注释分析结果。将PPI网络图导入Cytoscape软件进行可视化分析,运用cytohubba插件筛选出与CST4相互作用连接度较高的基因。

2.1 PAAD与正常组织中差异表达基因的筛选GSE15471包括36对PAAD和正常组织样本,GSE16515包括36个肿瘤样本和16个正常样本。GEO2R分别对2个芯片进行分析,筛查出差异倍数达2倍以上的显著DEGs,log2FC>1为上调基因,log2FC<-1为下调基因。通过韦恩图获得2个GEO数据芯片DEGs的交集,选定关键基因CST4。

2.2 CST4 mRNA在各种肿瘤组织中的表达 应用GEDS分析CST4 mRNA在TCGA不同肿瘤类型中的表达情况,从左至右以中位数为参照,CST4 mRNA表达量依次降低(图1A)。CST4在PAAD、直肠癌(rectum adenocarcinoma,READ)、结肠癌(colon adenocarcinoma,COAD)、胃癌(stomach adenocarcinoma,STAD)消化系统肿瘤中表达相对较高。同时根据CCLE可知CST4在胰腺细胞系中高表达(图1B)。

图1 CST4 mRNA在TCGA(A)和CCLE(B)数据库各种肿瘤组织的表达Fig.1 Expression of CST4 mRNA in various tumor tissues in TCGA (A) and CCLE (B) database

2.3 CST4在消化系统肿瘤组织的表达差异 加入GTEx数据库的正常组织作为对照,进一步评估了CST4在消化系统肿瘤与正常对照组织中的表达(图2)。CST4在胰腺癌和正常胰腺组织中的表达存在显著差异(P<0.05),肿瘤组织CST4表达水平相对较高。

图2 CST4 在消化系统肿瘤组织的表达Fig.2 Expression of CST4 in digestive system tumor tissues

2.4 CST4表达与PAAD患者生存预后的关系CST4 mRNA表达水平与PAAD患者的五年总体生存率、无复发生存率相关(P<0.05)。根据CST4 mRNA表达水平的中位数将PAAD患者分为低水平组69例和高水平组108例,CST4高表达患者的OS明显缩短(图3A)。无复发生存患者低水平组39例和高水平组30例,高表达组生存率较低(图3B)。

图3 CST4 在PAAD中的Kaplan-Meier生存曲线Fig.3 Kaplan-Meier curve of CST4 in PAAD

2.5 CST4表达与PAAD患者免疫细胞浸润情况的关系 TIMER2数据库显示CST4表达与PAAD不同免疫细胞浸润水平存在潜在联系(P<0.05)。基于EPIC算法,PAAD中CST4的表达水平与肿瘤相关成纤维细胞(cancer associated fibroblast,CAF)的浸润水平呈正相关(图4A);
基于XCell算法,与CD4+T细胞免疫浸润情况呈正相关(图4B);
基于QUANTISEQ算法,与巨噬细胞、中性粒细胞的免疫浸润存在正相关(图4C、D)。

图4 在PAAD中CST4表达与免疫细胞浸润的关系Fig.4 Relationship between CST4 expression and immune cell infiltration in PAAD

2.6 CST4相关蛋白及GO分析 为进一步了解CST4在人体内的功能机制,应用STRING数据库构建了CST4相关功能蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络(图5A),发现10个蛋白与CST4相互作用密切,设置最低相互作用分值为0.7。通过Cytoscape软件进行可视化分析,CST1、CSTA、CSTB、CTSB、CTSL与CST4相互作用连接度较高。根据每个基因的连接度排序,由红至黄,颜色越深代表其在整个PPI网络中的作用越显著(图5B)。GO功能注释结果显示,这些蛋白主要参与生物学过程(biological processes,BP)为蛋白质水解的负调控、半胱氨酸型内肽酶活性的负调控等;
主要参与细胞组成(cell composition,CC)为细胞外基质、细胞外泌体等;
主要参与分子功能(molecular function,MF)为CATs的活性、蛋白酶结合等。

图5 CST4蛋白相互作用网络Fig.5 Protein interaction network of CST4

PAAD具有起病隐匿、早期诊断困难、进展迅速、化学治疗不敏感等特点,大多数患者在确诊时已丧失治疗的最佳时机,因此预后较差[13]。目前,关于PAAD的发病机制尚未阐明,同时缺乏有效的系统治疗手段。高通量测序技术及基因芯片技术日趋成熟,深入了解PAAD发生发展过程中潜在的分子机制是改善PAAD患者预后的重要途径之一[14]。

基因芯片结合生物信息学方法能够有效分析与PAAD发生发展相关的差异表达基因,并分析DEG在肿瘤中的表达及生物学功能。基于TCGA和GTEx数据库分析证实了与正常胰腺组织相比,CST4在PAAD组织中表达明显增高。通过对TCGA数据库中PAAD患者生存预后信息的分析,可以发现CST4的表达水平明显影响患者的预后,高表达组的患者五年总体生存率和无复发生存率显著低于低表达组,这使得CST4有望成为评估PAAD的预后指标。

PAAD的肿瘤微环境包括CAFs、细胞外基质,各种免疫细胞及其释放的细胞因子,与肿瘤生长、侵袭和转移等生物学行为密切相关[15]。为了确定CST4的表达与PAAD中免疫细胞浸润的关系,利用TIMER2对CST4 mRNA表达水平与不同的免疫细胞浸润含量进行了相关性分析。结果显示,CST4表达与CAF、CD4+T细胞、巨噬细胞和中性粒细胞的浸润含量呈正相关。但是,基于不同算法得到的结论不同,每种算法都具有独特的属性和优势。其中EPIC和QuanTISEQ是推荐的通用算法,提供代表细胞的绝对分数[16]。CAF是肿瘤增生基质的细胞成分,会导致纤维化和促结缔组织增生,有助于肿瘤的生长、侵袭和转移[17]。研究表明,CST4在卵巢癌(ovarian cancer,OC)患者中高表达且与不良预后相关,而免疫细胞的浸润影响了OC患者的生存[18]。因此,推测高表达CST4通过某种机制促进PAAD中免疫细胞的浸润,影响肿瘤的侵袭及预后。

利用STRING构建CST4蛋白功能互作网络预测出10种功能蛋白与CST4相互作用,其中CST1、CSTA、CSTB、CTSB、CTSL与CST4关联密切且已被证实与PAAD的发生和进展有关。CST1、CSTA和CSTB均属于CSTs家族,CTSB、CTSL为半胱氨酸组织蛋白酶。YANG等[19]研究了Ⅱ型CSTs在PAAD组织中的表达,与正常组织相比,CST1、CST2、CST4、CST6和CST7的表达上调,CST3和CST5 mRNA水平下调。此外,CST1过表达有助于增殖相关蛋白表达、体外集落形成和异种移植物发育等,在PAAD中CST1表达上调促进了细胞的增殖[20]。CSTA在肿瘤组织中上调,达到一定水平可抵消过度表达的肿瘤相关蛋白水解活性。CSTA和CTSB在PAAD的肿瘤组织和肿瘤浸润性免疫细胞中均有表达,CSTA表达与局部肿瘤组织中的炎症状态有关,CTSB的表达与PAAD患者预后和复发有关[21]。研究表明,CSTB在PAAD中表达上调并与肿瘤的转移相关,高表达时患者总生存率低[22]。CSTB可调节细胞核中CTSL的蛋白水解活性,保护转录因子免受水解从而参与转录调控[23]。血浆CTSL水平可作为判断PAAD预后的潜在指标,该蛋白酶在PAAD组织中的表达水平明显高于癌旁组织,可能是肿瘤侵袭的原因之一[24]。

生物信息学分析是使用计算机系统收集和分析大量生物数据的技术,缺少试验数据支持验证,存在一定的局限性。未来可以从临床角度对CST4与肿瘤病理类型、肿瘤病理分级、术后预后的关系进行分析验证,也可以从基因的角度敲低CST4后研究PAAD细胞系的侵袭迁移情况。CST4有望成为PAAD诊断治疗及患者不良预后评估的潜在靶点,在PAAD发生与进展中的具体机制及生物学作用仍待进一步研究。

猜你喜欢 半胱氨酸蛋白酶生存率 血清高同型半胱氨酸在多发性骨髓瘤治疗及预后中的临床意义中华养生保健(2020年5期)2020-11-16“五年生存率”不等于只能活五年祝您健康·文摘版(2020年7期)2020-07-13人工智能助力卵巢癌生存率预测中国生殖健康(2019年2期)2019-08-23日本首次公布本国居民癌症三年生存率世界知识(2018年19期)2018-11-21思乡与蛋白酶文苑(2018年22期)2018-11-19“五年生存率”≠只能活五年老年教育(老年大学)(2018年12期)2018-01-28纤维素酶及其与蛋白酶和脂肪酶的复配在洗涤剂中的应用研究中国洗涤用品工业(2017年2期)2017-04-16西安地区同型半胱氨酸参考区间的初步建立现代检验医学杂志(2016年5期)2016-08-20菠萝蛋白酶酶解小麦降低过敏性中国粮油学报(2016年5期)2016-01-23IgA蛋白酶在IgA肾病治疗中的潜在价值西南军医(2016年6期)2016-01-23

推荐访问:半胱氨酸 生物 筛选