A Bioinformatics Analysis of Potential MicroRNAs Affecting Oral Cancer Development
-
摘要: 为获得口腔癌组织和正常组织之间差异表达的miRNAs,从分子水平研究相关的miRNAs在肿瘤发生发展中的作用,从GEO数据库筛选并下载口腔癌及正常组织的基因芯片,运用GEO2R工具分析筛选口腔癌与正常组织间的差异表达miRNAs. 采用FunRich软件对将所得差异miRNAs进行GO功能注释、KEGG信号通路分析. 通过对GSE124566和GSE113956两个芯片数据进行分析,分别筛选得到109、1 079个差异表达miRNAs,分别包括41、673个上调基因和68、406个下调基因,筛选得到共同差异表达miRNAs有30个,其中上调16个,参与的生物过程主要有细胞间通讯等,细胞成分主要有细胞核等,分子功能主要有转录因子活性等;下调14个,参与的生物过程主要有信号转导等,细胞成分主要有细胞质等,分子功能主要有转录因子活性等. 通过对口腔癌芯片数据的生物信息学分析,发现30个差异表达miRNAs是口腔癌发生、发展的重要miRNAs,囊泡介导的转运,核苷酸的代谢等过程. 最后预测出了13 796个靶基因,并通过PPI互作分析筛选出了联系最紧密的10个靶基因.
-
关键词:
- 生物信息学 /
- 口腔癌 /
- 差异表达miRNAs
Abstract: In order to obtain miRNAs expressed differently between oral cancer tissues and normal tissues, the role of miRNAs in tumor development was studied on the molecular level. Gene chips of oral cancer and normal tissues were screened and downloaded from the geo database. The differential expression of miRNAs between oral cancer and normal tissues was analyzed using GEO2R. The function annotation and KEGG signal path analysis of miRNAs are analyzed with the FunRich software. By analyzing the data of GSE124566 and GSE113956, 109 and 1 079 differential miRNAs were screened, including 41, 673 up-regulated genes and 68 and 406 down-regulated genes respectively. 30 miRNAs were screened. The 16 up-regulaed genes were involved in the biological process of intercellular communication, the cell components include nucleus and the molecular function mainly includes transcription factor activity. The 14 down-regulated genes were involved in the biological process of signal transduction, the cell components include cytoplasm, and the molecular function is transcription factor activity. Through the bioinformatic analysis of the oral cancer microarray data, it is found that 30 differentially expressed miRNAs are important miRNAs in the occurrence and development of oral cancer, including vesicle mediated transport and nucleotide metabolism. 13 796 target genes were predicted, and 10 target genes were screened with the PPI interaction analysis.-
Keywords:
- bioinformation /
- oral cancer /
- differentially expressed miRNAs
-
癌症已成为危害人类健康的最大因素之一[1],口腔癌是最常见的癌症之一,吸烟和饮酒被认为是其最主要的致病因素[2],1990—2017年世界口腔癌发病率和病死率增长了一倍[3]. 目前, 口腔癌主要的治疗手段是通过手术治疗,而且早期的口腔癌不容易诊断,降低了患者的生存率,且预后较差,晚期口腔癌患者的5年生存率仍然低于63%[4]. 近年来,大量研究表明,基因的异常表达是导致口腔癌发生与发展的重要因素,因此,从分子水平对口腔癌组织进行研究,探索口腔癌的发病机制和可能的治疗靶点具有重要意义.
微小核糖核酸(MicroRNAs, miRNAs)是由内源性发夹结构转录产物衍生而来的一种具有22个左右核苷的单链RNA[5],是基因表达的重要调节因子. miRNAs通过靶向mRNAs的翻译抑制或切割来抑制基因表达[6]. 据估计,30%的人类基因可能受到miRNAs的调控[7]. 越来越多的miRNAs与人类疾病的研究表明,miRNAs与人类疾病尤其是癌症的发生密切相关[8].
目前,生物信息学及基因芯片技术已广泛应用于基因变化所致肿瘤的研究中. 借助现有的miRNAs基因芯片数据,挖掘与口腔癌相关的miRNAs可以探索口腔癌的发生机制,并对口腔癌的早期诊断及治疗提供数据及基础. 本研究利用生物信息学方法对GEO数据库中的口腔癌miRNAs表达数据进行分析,筛选差异表达的miRNAs,并通过基因富集分析分析差异表达的miRNAs的功能,为口腔癌的靶向治疗提供一定的理论依据.
1. 材料与方法
1.1 数据来源
口腔癌miRNAs芯片表达数据集(GSE124566和GSE113956)从GEO数据库[9](https://www.ncbi.nlm.nih.gov/geo)下载,GSE124566含有10个口腔癌组织样本和10个正常组织样本,GSE113956含有25个口腔癌组织样本和15个正常组织样本. 平台分别为GPL18402和GPL18058,芯片研究类型为Non-coding RNA profiling by array,种属为homo sapiens,都是标准的口腔组织,具有代表性与典型性.
1.2 数据处理与筛选
利用GEO2R在线分析工具(http://www.ncbi.nlm.nih.gov/geo/geo2r/)分析口腔癌与正常组织之间的差异表达miRNAs. 针对差异表达miRNAs采用阈值标准来计算基因表达的Fold Change和校正P值, P≤0.05, |log2 FC|≥1作为有统计学意义为标准,每个数据集的所有差异用miRNAs火山图表示.
为了使结果更加规范、准确,需要使用Venn Diagram在线工具(http://bioinformatics.psb.uget.be/webtools/Venn)进行筛选上述2个数据集共同的差异表达miRNAs.
1.3 差异miRNAs功能富集分析
基因本体论分析[10](Gene Ontology,GO)是对基因和蛋白功能进行分类和描述的分析,包括细胞学组分(Cellular Components, CC)、生物学过程(Biological Process, BP)、分子生物学功能(Molecular Function, MF). 京都基因和基因组百科全书[11](KEGG)用于注释参与其中的基因列表和信号通路网络.
FunRich(http://funrich.org/)是一个独立的软件工具,主要用于基因和蛋白质的功能和相互作用网络分析[12],可用于绘制韦恩图,其最大的优点是可以进行基因ID转换、基因富集和miRNAs的富集分析并可直接进行可视化等. 本研究利用FunRich3.1.3对GO和KEGG通路进行富集分析来确定差异表达miRNAs的功能.
1.4 差异表达miRNAs靶基因预测
为了探索上述筛选出来的差异表达miRNAs作用的靶标基因,方便后期对靶标基因进行研究. 本研究使用miRWalk3.0(http://mirwalk.umm.uni-heidelberg.de/)对差异表达的miRNAs进行靶标基因的预测.
1.5 蛋白相互作用分析
利用FunRich寻找靶基因的蛋白相互作用关系,筛选连接度前10位的基因作为网络核心基因.
2. 结果
2.1 差异表达miRNAs筛选
本研究从GEO(Gene Expression Omnibus)数据库下载了2个不同的口腔癌miRNAs芯片表达数据集(GSE124566和GSE113956),GSE124566含有10个口腔癌组织样本和10个正常组织样本,GSE113956含有25个口腔癌组织样本和15个正常组织样本. 用GEO2R在线分析工具,调整后P≤0.05, |log2 FC|≥1作为截断值的标准,以分析口腔癌和正常组织之间的差异表达miRNAs.
在GSE124566和GSE1139566中分别筛选了总共109、1 079个差异表达miRNAs,分别包括41、673个上调基因和68、406个下调基因,图 1为这2个数据集的火山图,横坐标表示log2 FC(癌症样本比正常样本),纵坐标表示-log10 P. 其中黄色的点表示不显著的差异表达miRNAs,红色的点表示上调的差异表达miRNAs,蓝色的点表示下调的差异表达miRNAs.
2.2 共同差异表达miRNAs
为了得到更有可信度的差异表达miRNAs,分别对2个数据集上调和下调的miRNAs分别绘制韦恩图取交集(图 2),结果得出16个上调的共表达差异miRNAs(表 1)和14个下调的共表达差异miRNAs(表 2).
表 1 16个差异表达上调的miRNAs的P及log2 FCTable 1. The P value and log2 FC of 16 miRNAs with up-regulated differential expressionmiRNA P log2 FC hsa-miR-513b 6.330×10-9 2.750 163 hsa-miR-744-5p 2.233×10-8 2.284 359 hsa-miR-375 7.553×10-16 4.135 624 hsa-miR-1471 1.173×10-3 1.197 684 hsa-miR-598 1.253×10-4 1.090 587 hsa-miR-4324 1.623×10-5 1.356 905 hsa-miR-378a-5p 3.103×10-8 3.065 295 hsa-miR-29c-5p 8.863×10-12 3.915 925 hsa-miR-1224-5p 2.123×10-4 1.316 750 hsa-miR-3911 1.783×10-21 2.475 252 hsa-miR-4647 4.793×10-10 2.891 719 hsa-miR-3188 1.823×10-18 4.603 102 hsa-miR-24-1-5p 4.683×10-3 1.151 63 hsa-miR-204-5p 1.333×10-3 1.574 574 hsa-miR-338-3p 1.023×10-6 2.736 121 hsa-miR-513c-5p 2.153×10-17 2.510 716 表 2 14个差异表达下调的miRNAs的P及log2 FCTable 2. The P value and log2 FC of 14 miRNAs with down regulated differential expressionmiRNAs P log2 FC hsa-miR-4778-5p 2.593×10-14 -2.410 98 hsa-miR-31-5p 1.933×10-2 -1.342 41 hsa-miR-299-3p 1.743×10-6 -2.222 96 hsa-miR-4419a 1.453×10-11 -3.270 17 hsa-miR-223-3p 1.583×10-6 -1.155 63 hsa-miR-142-5p 1.293×10-4 -2.564 01 hsa-miR-23a-5p 1.753×10-12 -1.997 68 hsa-miR-374c-5p 7.603×10-4 -1.400 69 hsa-miR-454-3p 2.263×10-4 -1.954 80 hsa-miR-625-5p 6.983×10-20 -3.165 28 hsa-miR-765 1.823×10-3 -1.113 14 hsa-miR-21-5p 1.523×10-4 -1.207 61 hsa-miR-142-3p 9.313×10-4 -2.640 01 hsa-let-7i-5p 6.863×10-8 -1.426 81 LU等[13]将6种口腔癌细胞系与正常角质形成细胞作比较,发现在口腔癌细胞系中miR-31表达下调,这与本研究结果一致.
2.3 共同表达差异基因功能分析
为了进一步明确30个共同差异表达miRNAs的生物学功能,利用软件FunRich对差异表达miRNAs进行了GO与KEGG生物途径富集分析.
2.3.1 GO分析
GO分析结果显示:16个上调的miRNAs的细胞组分主要在细胞核(Nucleus)、细胞质(Cytoplasm)、细胞质膜(Plasma membrane)、溶酶体(Lysosome)和核仁(Nucleolus)(图 3A);分子功能主要集中在转录因子活性(Transcription factor activity)、转录调节活性(Transcription regulator activity)、RNA结合(RNA binding)、丝氨酸/苏氨酸激酶活性(Protein serine/thereonine kinase activity) 和受体信号蛋白丝氨酸/苏氨酸蛋白激酶活性(Receptor signacling protein serine/threonine kinase activity)(图 3B);生物学过程主要富集在在转运(Transport),信号转导(Signal transduction),碱基、核苷、核苷酸和核酸代谢的调节(Regulation of nucleobase, nucleoside, nucleotide and nuclelc acid metabolism),基因表达和表观遗传的调控(Regulation of gene expression,epigenetics),囊泡介导的转运(Vesicle-mediated transport)(图 3C).
14个下调的miRNAs的细胞组分主要富集细胞核(Nucleus)、细胞质(Cytoplasm)、细胞质膜(Plasma membrane)和溶酶体(Lysosome)和高尔基体(Golgl aparatus)(图 4A);分子功能主要集中转录因子活性(Transcription factor activity)、转录调节活性(Transcription regulator activity)、RNA结合(RNA binding)、泛素蛋白特异性蛋白酶活性(Ubiquitin-specific protease activity)和转运蛋白活性(Transporter activity)(图 4B);生物学过程主要富集在转运(Transport),信号转导(Signal transduction),碱基、核苷、核苷酸和核酸代谢的调节(Regulation of nucleobase, nucleoside, nucleotide and nucleic acid metabolism),基因表达和表观遗传的调控(Regulation of gene expression, epigenetics)和细胞间通讯(Cell communication)(图 4C).
2.3.2 KEGG分析
KEGG/生物途径分析显示:上调的miRNAs主要参与蛋白多糖多配体多糖介导的信号(Proteoglycan syndecan-mediated signaling events)、ErbB受体信号网络(ErbB receptor signaling network) 和磷脂酰肌醇蛋白聚糖通路(Glypican pathway)、质膜雌激素受体信号转导(Plasma membrane estrogen receptor signaling)和LKB1信号(LKB1 signaling events)(图 5A). 另外,下调的miRNAs主要参与蛋白多糖多配体多糖介导的信号(Proteoglycan syndecan-mediated signaling events)、ErbB受体信号网络(ErbB receptorsignaling network)和磷脂酰肌醇蛋白聚糖相关通路(Glypican pathway)、β整合素细胞表面相互作用(β integrin cell surface interactions),和整合素家族细胞表面相互作用(Integrin family cell surface interactions)(图 5B).有研究表明miR-23、miR-142-3p以及miR-223参与了口腔癌变的磷脂酰肌醇激酶参与的相关通路[14],与本研究结果一致.
2.4 差异表达miRNAs靶基因预测
经过前面的筛选,获得了30个共同差异表达的miRNAs,打开靶标基因预测工具miRWalk3.0,点击Target Ming里的miRNAs,导入30个差异表达的miRNAs进行靶基因预测,最后得到SMG7、NFIA、RIMS1、POTEA 等13 796个靶基因.
2.5 基因蛋白相互作用分析
利用FunRich对靶基因进行相互作用分析,获得了蛋白相互作用网络,经筛选并在蛋白相互作用网络中寻找连接数前10位的作为核心基因. 经过筛选发现,编码生长因子受体结合蛋白2基因(GRB2)、编码表皮生长因子受体基因(EGFR)、编码酪氨酸3单加氧酶基因(YWHAG)、编码调控细胞分裂增殖的Tp53蛋白基因(TP53)、酪氨酸激酶基因(ABL1) 、肿瘤坏死因子受体相关因子(TRAF6)、编码核蛋白的癌基因(MYC)、转化生长因子TGF-β信号转导相关基因(SMAD2)、B细胞k轻肽基因增强子抑制因子(IKBKE)和编码非受体酪氨酸激酶基因(SRC)是靶基因相关蛋白相互作用网络中的核心基因.
3. 讨论
目前,对口腔癌的治疗来说,大多数还是放疗、化疗和手术切除病变位置,这些方法的治疗效果不理想,预后较差,导致口腔癌患者的生存率不高,对于口腔癌在分子层面的发病机制和预后机制的研究也相对较少. 所以,研究发现有关口腔癌在分子层面的发病机制有利于对口腔癌有更清楚的认识,以及更有利于研发癌症靶向治疗的药物.
根据上文可以发现:(1)在分子功能方面,差异表达的miRNAs最显著集中于转录调节活性和转录因子活性. 可见,差异表达的miRNAs对某种口腔癌基因的表达有显著或轻微的抑制作用,是普遍转录因子还是特异性转录因子发挥作用尚不明确. (2)在细胞组分方面,差异表达下调的miRNAs与差异表达上调的miRNAs不同的是下调的miRNAs富集于高尔基体,其作用主要是将蛋白质加工和运输后送到细胞特定的部位或者细胞外,差异表达下调的miRNAs这一独特的作用也在分子功能富集上得到了验证,差异表达下调的miRNAs区别于上调的miRNAs不同的是下调的miRNAs主要富集在蛋白转运. 根据这一特点可知,下调的miRNAs对某些蛋白的转运起作用,后期如果能找到生物标志物,那么下调miRNAs很有可能成为新的治疗靶点. (3)在生物学过程方面,上调和下调miRNAs主要差别在于转运和细胞间通讯过程,可推测它们分别参与物质传递和信息交流相关过程. (4)在差异表达miRNAs参与的生物通路方面,不同之处在于上调的miRNAs主要参与质膜雌激素受体信号转导和LKB1信号通路,下调的miRNAs主要参与整合素家族细胞表面相互作用相关通路,这些都可能对研究口腔癌患者发生恶性肿瘤的机制和预后机制提供一些线索.
本研究也存在一定的局限性,差异表达的miRNAs以及涉及到的生物信号通路,尚未进行分子水平的验证,这将是下一步的研究目标.
4. 结论
本研究对口腔癌与正常组织间的差异表达miRNAs进行分析,并对差异miRNAs进行GO功能注释、KEGG信号通路分析,使我们能够识别出一些miRNA,通过分析预测并通过PPI互作分析筛选出了联系最紧密的靶基因. 这些数据会为口腔癌检测提供一些有用的信息和方向.
-
表 1 16个差异表达上调的miRNAs的P及log2 FC
Table 1 The P value and log2 FC of 16 miRNAs with up-regulated differential expression
miRNA P log2 FC hsa-miR-513b 6.330×10-9 2.750 163 hsa-miR-744-5p 2.233×10-8 2.284 359 hsa-miR-375 7.553×10-16 4.135 624 hsa-miR-1471 1.173×10-3 1.197 684 hsa-miR-598 1.253×10-4 1.090 587 hsa-miR-4324 1.623×10-5 1.356 905 hsa-miR-378a-5p 3.103×10-8 3.065 295 hsa-miR-29c-5p 8.863×10-12 3.915 925 hsa-miR-1224-5p 2.123×10-4 1.316 750 hsa-miR-3911 1.783×10-21 2.475 252 hsa-miR-4647 4.793×10-10 2.891 719 hsa-miR-3188 1.823×10-18 4.603 102 hsa-miR-24-1-5p 4.683×10-3 1.151 63 hsa-miR-204-5p 1.333×10-3 1.574 574 hsa-miR-338-3p 1.023×10-6 2.736 121 hsa-miR-513c-5p 2.153×10-17 2.510 716 表 2 14个差异表达下调的miRNAs的P及log2 FC
Table 2 The P value and log2 FC of 14 miRNAs with down regulated differential expression
miRNAs P log2 FC hsa-miR-4778-5p 2.593×10-14 -2.410 98 hsa-miR-31-5p 1.933×10-2 -1.342 41 hsa-miR-299-3p 1.743×10-6 -2.222 96 hsa-miR-4419a 1.453×10-11 -3.270 17 hsa-miR-223-3p 1.583×10-6 -1.155 63 hsa-miR-142-5p 1.293×10-4 -2.564 01 hsa-miR-23a-5p 1.753×10-12 -1.997 68 hsa-miR-374c-5p 7.603×10-4 -1.400 69 hsa-miR-454-3p 2.263×10-4 -1.954 80 hsa-miR-625-5p 6.983×10-20 -3.165 28 hsa-miR-765 1.823×10-3 -1.113 14 hsa-miR-21-5p 1.523×10-4 -1.207 61 hsa-miR-142-3p 9.313×10-4 -2.640 01 hsa-let-7i-5p 6.863×10-8 -1.426 81 -
[1] 刘智明, 郭周义. 氧化石墨烯: 一种用于癌症诊断与治疗的新型纳米试剂[J]. 华南师范大学学报(自然科学版), 2014, 46(4): 1-11. doi: 10.6054/j.jscnun.2014.06.101 LIU Z M, GUO Z Y. A novel nano-theranostic agent for cancer[J]. Journal of South China Normal University(Natural Science Edition), 2014, 46(4): 1-11. doi: 10.6054/j.jscnun.2014.06.101
[2] FERLAY J, COLOMBET M, SOERJOMATARAM I, et al. Estimating the global cancer incidence and mortality in 2018: GLOBOCAN sources and methods[J]. International Journal of Cancer, 2019, 144(8): 1941-1953. doi: 10.1002/ijc.31937
[3] 任振虎, 胡传宇, 李媛洁. 1990年至2017年口腔癌的全球和区域负担: 疾病全球负担研究报告[J]. 癌症, 2020, 39(4): 159-171. https://www.cnki.com.cn/Article/CJFDTOTAL-AIZH202004003.htm REN Z H, HU C Y, LI Y J, et al. Global and regional burden of oral cancer, 1990-2017: research report of global burden of disease[J]. Cancer, 2020, 39(4): 159-171. https://www.cnki.com.cn/Article/CJFDTOTAL-AIZH202004003.htm
[4] MARCAZZAN S, VARONI E M, BLANCO E, 等. 纳米药物: 一种新型口腔癌治疗方法[J]. 中国口腔颌面外科杂志, 2018(1): 47. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGKQ201801015.htm MARCAZZAN S, VARONI E M, BLANCO E, et al. Nanomedicine, an emerging therapeutic strategy for oral cancer therapy[J]. China Journal of Oral and Maxillofacial Surgery, 2018(1): 47. https://www.cnki.com.cn/Article/CJFDTOTAL-ZGKQ201801015.htm
[5] 王成, 张春妮. 微小核糖核酸与心血管系统的生理病理关系[J]. 中国动脉硬化杂志, 2009, 17(1): 73-77. https://www.cnki.com.cn/Article/CJFDTOTAL-KDYZ200901023.htm WANG C, ZHANG C N. Physiological and pathological relationship between microribonucleic acid and cardiovascular system[J]. Chinese Journal of Arteriosclerosis, 2009, 17(1): 73-77. https://www.cnki.com.cn/Article/CJFDTOTAL-KDYZ200901023.htm
[6] 丁苗, 涂萍. miRNA靶向RAS-MAPK通路的表观遗传性激活与肿瘤[J]. 临床与病理杂志, 2016, 36(11): 1868-1872. doi: 10.3978/j.issn.2095-6959.2016.11.034 DING M, TU P. Epigenetic activation the miRNAs target the RAS-MAPK pathway and cancer[J]. Journal of Clinical and Pathological Research, 2016, 36(11): 1868-1872. doi: 10.3978/j.issn.2095-6959.2016.11.034
[7] 于倩倩, 郭人花. miR-1与肿瘤[J]. 中华临床医师杂志, 2013, 7(17): 7917-7919. https://www.cnki.com.cn/Article/CJFDTOTAL-ZLYD201317061.htm YU Q Q, GUO R H. MiR-1 and Tumors[J]. Chinese Journal of Clinicians, 2013, 7(17): 7917-7919. https://www.cnki.com.cn/Article/CJFDTOTAL-ZLYD201317061.htm
[8] 张群, 罗艳. MiR-183基因簇对动物感觉器官功能和发育及肿瘤发生的调控[J]. 中国生物化学与分子生物学报, 2012, 7(12): 1458-1461. https://www.cnki.com.cn/Article/CJFDTOTAL-SWHZ201207003.htm ZHANG Q, LUO Y. MiR-183 MicroRNA cluster functions in animal sensory organ biology and human cancer[J]. Chinese Journal of Biochemistry and Molecular Biology, 2012, 7(12): 7917-7919. https://www.cnki.com.cn/Article/CJFDTOTAL-SWHZ201207003.htm
[9] BARRETT T, WILHITE S E, LEDOUX P, et al. NCBI GEO: archive for functional genomics data sets: update[J]. Nucleic Acids Research, 2013, 41(Database Issue): D991-D995. http://nar.oupjournals.org/content/early/2012/11/26/nar.gks1193.full-text-lowres.pdf
[10] GENE O C, MULDER N. The gene ontology(GO) project in 2006[J]. Nucleic Acids Research, 2006, 34(23): D322-D326. http://core.ac.uk/download/pdf/4870235.pdf
[11] MINORU K, MIHO F, YOKO S, et al. KEGG: integrating viruses and cellular organisms[J]. Nucleic Acids Research, 2021, 49(1): D545-D551. http://www.researchgate.net/publication/346154870_KEGG_integrating_viruses_and_cellular_organisms
[12] PATHAN M, KEERTHIKUMAR S, CHISANGA D, et al. A novel community driven software for fun-ctional enrichment analysis of extracellular vesicles data[J]. Extracell Vesicles, 2017, 6(1): 1321455/1-5. http://www.repository.cam.ac.uk/bitstream/1810/269982/1/A
[13] LU Y C, CHEN Y J, WANG H M, et al. Oncogenic function and early detection potential of miRNA-10b in oral cancer as identified by microRNA profiling[J]. Cancer Prevention Research, 2012, 5(4): 665-674. doi: 10.1158/1940-6207.CAPR-11-0358
[14] MANIKANDAN M, KUHA D M R A, ARUNKUMAR G, et al. Oral squamous cell carcinoma: microRNA expression profiling and integrative analyses for elucidation of tumourigenesis mechanism[J]. Molecular Cancer, 2016, 15(1): 28-45. doi: 10.1186/s12943-016-0512-8