admin 管理员组

文章数量: 1087135


2024年5月1日发(作者:branching是什么意思)

238

World Latest Medicne Information (Electronic Version) 2021 Vo1.21 No.22

·医学检验·

基于GEO数据库的脓毒症标志物的筛选与生物信息学分析

童译庆,高婧,段光臣,周伟,秦海军

*(通信作者)

(上海交通大学附属第六人民医院 急诊医学科,上海 200233)

要:目的

使用生物信息学方法从基因表达数据库(Geneexpression omnibus,Geo)分析及筛选脓毒症关键

差异基因并揭示潜在的分子机制,为脓毒症的治疗提供新靶点。

方法

从基因表达数据库中获取芯片Gse28750,

Gse57065以及Gse33118,共包含脓毒症58例,健康对照65例。分别使用r软件limma包筛选出差异表达基因

(deGs),使用rra包对差异数据进行合并。通过daVid在线工具对dGes富集进行基因本体(Go)分析,

reactoMe通路分析。通过strinG在线数据库构建dGes的蛋白-蛋白相互作用(PPi)网络。使用cytoscape中

Mcode插件筛选出脓毒症发生的重要模块和高度关联性的差异基因。

结果

脓毒症与对照组共有显著差异基因282

个基因,其中上调基因181个,下调基因101个,deGs主要涉及的生物过程包括:白细胞脱颗粒,免疫激活,抗原提

呈,血液凝固等方面,通路分析发现信号通路主要涉及中性粒细胞脱颗粒,t细胞受体瀑布,白介素家族信号通路

等。Mcode插件从PPi网络中检测出3个重要模块,其中MceMP1、itGaM、cYstM1以及MGaM等16个高度关联

的基因被发现。

结论

利用生物信息学从不同角度揭示了脓毒症和健康对照组差异基因的特征,可以帮助我们更好

了解脓毒症发生的分子机制,对于脓毒症的早期诊断和治疗具有重要临床意义。

关键词:

Geo数据库,脓毒症,r软件,limma包,差异表达基因

中图分类号:r714.62+6    文献标识码:B    doi:10.3969/.1671-3141.2021.22.115

本文引用格式:

童译庆,高婧,段光臣,等.基于GEO数据库的脓毒症标志物的筛选与生物信息学分析[J].世界最新医学信

息文摘,2021,21(22):238-242.

Identification of Candidate Biomarkers and Pathways in

Sepsis by Bioinformatics Analysis

Tong Yi-qing, GAO Jing, DUan Guang-chen, ZHOU Wei, QIN Haijun *

(Department of emergency medicine, the Sixth People's Hospital Affiliated to Shanghai Jiaotong University,Shanghai 200030)

ABSTRACT

Objective

To identify the different expression genes of septic patients from the Gene Expression

OmniBus database. The current study conducted bioinformatics analyses to explore the molecular mechanism of

sepsis and thus to provide some therapeutic targets for sepsis in clinical practice.

Methods

The datasets of GSE28750,

GSE57065 and GSE33118 were downloaded from GEO database, including 58 septic patients and 65 healthy controls.

The differentially expressed genes (DEGs) were screened by “limma” R package, and merged by “RRA” R package.

DGEs were enriched and gene ontology (GO) analysis and REACTOME pathway analysis were performed by

DAVID online protein-protein interaction (PPI) network of DGEs was constructed through STRING online

database. The M-CODE plug-in of Cytoscape was used to screen out the important modules and highly correlated

differential genes of sepsis.

Results

There are 282 genes with significant difference between sepsis and control

group, including 181 up-regulated genes and 101 down-regulated genes. The biological processes of DEGs include

leukocyte degranulation, immune activation, antigen presentation, blood coagulation and so on. Pathway analysis

shows that signal pathways mainly involve neutrophil degranulation, T cells receptor waterfall, interleukin family

signaling pathway, etc. MCODE plug-in detects three important modules from PPI network, among which 16 highly

related genes such as MCEMP1, ITGAM, CYSTM1 and MGAM are found.

Conclusion

s Bioinformatics can reveal

the potential characteristics of gene differences between sepsis and healthy control which can help us have a better

understanding the pathogenesis of sepsis and provide us a new insight into the treatment of sepsis in clinical practice.

KEYWORDS

GEO database; sepsis; R; limma; differentially expressed genes

0 引言

脓毒症是机体对于感染反应失调导致的器官功能失

调的综合征

[1]

,是急诊ICU常见的急危重症,临床上有极

高的发病率和病死率

[2]

,世界卫生组织每年有3000万脓毒

症,1940万严重脓毒症每年有600万病例死于脓毒症

[3]

病原体入侵引起免疫失衡最终导致的持续过度的炎症反

应和晚期剧烈持久免疫抑制是它的主要病理特征,免疫

介导损伤被仍为是导致器官损伤的重要原因

[4-5]

。促炎反

应包括有补体系统,凝血反应,血管内皮细胞,白细胞

以及血小板的激活,免疫抑制主要是抗原提呈的重新编

投稿邮箱:zuixinyixue@

排以及淋巴细胞的耗竭

[6-7]

。尽管目前对于脓毒症发病机

制较前已经大大增加,但仍需转化为新的靶向治疗。因

此通过系统生物学方法深入了解脓毒症的免疫发病机制

对于脓毒症的诊断和治疗都有极其重要的作用。近年来

随着基因检测技术和生物信息学的发展,这一领域的突

破将为脓毒症的早期诊断、预后分析和基因治疗提供新

的思路。目前已经有对脓毒症基因表达谱进行的大量的

研究,筛选出数千个可能与脓毒症相关的差异表达基因

(DEGs),但是各个样本的异质性不同,不同技术检测

的平台,不同数据处理的方法以及样本来自不同的背景

Copyright©博看网 . All Rights Reserved.

世界最新医学信息文摘 2021年 第21卷 第22期

等,均可能导致不同研究间存在差异,即使在单一的队

列研究中仍然存在局限性。因此,我们需要用一种不偏

倚的统计方法处理数据,通过合并分析基因表达谱可以

解决部分问题。RobusRankAggreg使用一个概率模型

对于合并的基因进行比较打分排名,能有效降低模型噪

声以及区分显著性差异基因,筛选出的基因排名越高,

P

值越小

[8]

。本研究通过检索GEO数据库中脓毒症患者

的基因芯片,利用R软件分析分析和筛选DEGs以及相互

作用关系及其调控网络,为深入研究脓毒症分子机制及

其早期诊断提供思路。

239

对进行预处理,删除缺失值以及基因对多探针情况,随后

对于样本进行标准化处理及数据整理,由图1的箱式图可

见3组数据标准化后数值分布较好,然后使用Limma包对

标准化后的数据进行差异分析发现3组数据分别有881,

935,2526个,DEGs表达火山图见图2,由图可知这些差

异基因对于脓毒症和健康对照区分良好。随后这些DEGs

进行聚类分析,聚类热图见图3。三组数据都能明显区分

脓毒症组和健康对照组,通过采用RobustRankAggreg法

对于三组数据进行筛选共获得DEGs 281个,其中上调基

因181个,下调100个。DEGs前20个基因见图4。

1 资料与方法

1.1 数据集的获取和资料分析。以“sepsis”作为搜索词,

进入美国国立生物技术信息中心(NCBI)的GEO数据库搜

索已公布脓毒症数据集,获取数据集GSE57065,GSE33118,

GSE28750三套数据集,三套数据集的信息见表1。

表1 三组数据集的基本信息

数据集

GSE57065

GSE33118

样本来源

法国

法国

样本信息

脓毒症10列,健康对照20列

脓毒症休克28列,健康对照25列

肺炎导致脓毒症休克20列以及

对照20个健康对照20列(来自

GSE10715和GSE12711数据集的)

样本平台

GPL570

GPL570

GPL570

GSE28750澳大利亚

1.2 DEGs的表达分析与数据合并 数据分析均采用R

语言各软件包进行,原始数据通过RMA算法对原始数

据进行标准化,DEGs的分析采用R软件的limma包,

limma是Bioconductor下专门用于处理芯片数据的R语

言包,其中limma算法设计到实验矩阵、基因表达线性

模型、先验分布引入、后验分布分析和超参数估计等

多方面的算法,是目前基因芯片数据处理中较好的算

法,也是目前使用较多的算法

[9]

。选择差异倍数 log fold

change>1.0,

P<

0.05来筛选DEGs。数据合并采用R语言

RobustRankAggreg(RRA)包,RRA是使用概率模型

对于芯片基因进行聚合排名,筛选

P<

0.05,对于三套数

据DEGs进行打分聚合,筛选出差异表达的关键基因。

1.3 功能富集分析和蛋白相互作用 获得DEGs后采用

DAVID在线数据库对于DEGs进行GO分析、通路分

析。分别从基因的生物过程(biological process)、

分子功能(molecular function)、细胞组分(cellular

component)3个方面对于基因进行富集分析,结果

采用Benjamini矫正法矫正

P

值进行筛选,

P<

0.05。使

用STRING在线数据库()对于

DEGs进行蛋白-蛋白相互作用的网络分析(PPI),采用

Cytoscape软件获取PPI网络图,使用M-CODE插件对于

PPI网络进行模块分析获取关键靶基因。

图2 三组数据的火山图,红色部分为上调基因,绿色部分为下调基因

图1 三组数据的标准化,蓝图为原始数据的箱图,红图为

中位数标准化后的箱图

2 结果

2.1 脓毒症患者的DEGs表达分析。在进行差异分析前先

图3 三组数据的聚类热图

投稿邮箱:zuixinyixue@

Copyright©博看网 . All Rights Reserved.

240

World Latest Medicne Information (Electronic Version) 2021 Vo1.21 No.22

(biological process)中差异最显著的是T细胞受体信号

通路,MHC-II多肽多糖抗原提呈和加工,以及固有免疫

激活,免疫应答等。分子功能(Molecular function)中

差异最显著的是MHCII受体的活性,结合蛋白激酶,白

介素-1受体活性,结合RAGE受体等。Pathway分析采用

在DAVID在线工具中reactome通路分析如表2所示,其

中差异最显著的通路是中性粒细胞脱颗粒,免疫激活和

固有免疫的激活,通路分析中还有T细胞受体瀑布通路。

通过STRING在线工具绘出这差异的281个差异基因的蛋

白蛋白互相作用网络分析图,结果如图6所示,将蛋白蛋

白互相作用结果导入Cytoscape采用MCODE对差异基

因进行模块分析,共筛选4个模块,筛出16个关键基因,

其包括FCER1G,CLEC4D,BST1,CKAP4,HVCN1,

C3AR1,CD59,CYSTM1,MGAM,STOM,GPR84,

ITGAM,CLEC5A,CEACAM1,FCAR,MCEMP1关

键靶基因图见图7。

图4 三组数据差异基因根据RRA分析分值做的聚类分析

表2 差异基因在reactome在线网站上做的通路分析

Pathway ID

R-HSA-6798695

R-HSA-168256

R-HSA-168249

R-HSA-389948

R-HSA-202427

R-HSA-202403

R-HSA-388841

R-HSA-202424

R-HSA-449147

R-HSA-164944

R-HSA-6785807

R-HSA-9012546

R-HSA-446652

R-HSA-1280215

R-HSA-2132295

R-HSA-168898

Pathway name

Neutrophil degranulation

Immune System

Innate Immune System

PD-1 signaling

Phosphorylation of CD3 and TCR

zeta chains

TCR signaling

Costimulation by the CD28 family

Downstream TCR signaling

Signaling by Interleukins

Nef and signal transduction

Interleukin-4 and Interleukin-13

signaling

Interleukin-18 signaling

Interleukin-1 family signaling

Cytokine Signaling in Immune

system

MHC class II antigen presentation

Toll-like Receptor Cascades

P-value

3.33E-15

3.86E-07

6.28E-07

7.34E-07

7.34E-07

8.94E-05

2.83E-04

3.95E-04

0.005957787

0.01619616

0.016357509

0.023531706

0.025121893

0.029347226

0.041217398

0.045703032

number

43

93

56

9

9

12

9

10

24

2

10

2

8

32

7

8

2.2 差异基因的GO分析以及Pathway分析。采用David

在线工具对于DEGs做GO分析,如图5组图所示,细

胞组分(cellular component)中差异最显著的依次为

细胞膜,细胞外外泌体,T细胞受体复合物。生物过程

投稿邮箱:zuixinyixue@

图5 DEGs做的基因本体分析(GO分析):分别为差异基因的

分子功能、细胞组分和生物过程

Copyright©博看网 . All Rights Reserved.

世界最新医学信息文摘 2021年 第21卷 第22期

241

3 讨论

作为ICU患者死亡原因的首位,脓毒症发病率高,

病死率高,医疗资源消耗大,被誉为隐藏的“公共卫生

灾难”

[10]

。脓毒症的发生源于宿主对于感染产生的免疫

失调,脓毒症的发生和发展是一个动态复杂的过程,有

各种相关基因的异常表达,炎症因子及趋化因子共同参

由此可见脓毒症的发生与免疫异常促炎反应过度有

关。通过STRING对这些基因做相互作用的网络分析

以及Cytoscape的模块分析发现FCER1G,CLEC4D,

BST1,CKAP4,HVCN1,C3AR1,CD59,

CYSTM1,MGAM,STOM,GPR84,ITGAM,

CLEC5A,CEACAM1,FCAR,MCEMP1。这16个差

异基因可能是脓毒症发生的关键位点。其中,FCER1G

能转导来自各种免疫受体的信号信息,并激活下游

通路,能诱导ITAM磷酸化,引发SYK,CARD9以及

NF-KB的活化,引发外源抗原引起的促炎反应,调节

急性炎症反应

[11]

。CLEC4D和CLEC5A是C型凝集素结

构域家族成员,CLEC4D是一种钙依赖的凝集素,真菌

感染时,能与病原相关分子模式(PAMPs)相结合,

引起下游的NF-KB的活化从而影响T细胞向Th1细胞和

Th17细胞分化,促进ROS产生,参与固有免疫反应

[12]

CLEC5A则是巨噬细胞上的受体,在病毒感染时触发信

号转导引起促炎因子释放

[13]

。BST1是ADP-核糖基环化

酶参与体液免疫的激活以及正向B细胞增殖的作用

[14]

HVCN1介导质子跨膜转运介导中性粒细胞脱颗粒

[15]

CYSTM1、MGAM、STOM被富集到与中性粒细胞脱颗

粒有关。GPR84是炎症相关的G蛋白偶联受体EX33。整

合素ITGAM参与单核细胞、巨噬细胞、粒细胞的相互粘

附,参与中性粒细胞吞噬作用、诱导细胞凋亡以及参与

图6 差异基因蛋白-蛋白相互作用网络图

补体介导的病原体的识别

[16]

。CEACAM1参与病毒感染

后T细胞信号通路的负性调节,IL-1的负性调节以及粒细

胞分化的负调节、血小板聚集的负性调节,在炎症瀑布

发展中起到一定促进作用

[17]

。FCAR是免疫球蛋白FC受

体,参与介导细胞因子的产生、细胞对于脂多糖及IL-6

反应、中性粒细胞凋亡的正调节

[18]

。这些基因均在感染

后宿主的免疫中起到重要作用,推测可能是脓毒症发展

中的关键基因之一。

综上所述:本研究以脓毒症为中心,通过GEO数据

库的芯片数据进行挖掘检索,对采用RRA法对于3组脓

毒症血样本芯片原始数据内容进行分析,并通过统计学

分析方法找到脓毒症和正常人血的差异表达基因,有望

为脓毒症发生的机制研究,脓毒症标志物的筛选及治疗

靶点的选择提供参考。但是脓毒症的发生发展是复杂且

多因素的疾病,研究中所涉及的差异基因仅部分基因,

甚至可能脓毒症发生后的部分基因,以后的研究仍然需

要进一步的分子研究进行验证。

参考文献

[1] Singer M,Deutschman CS,Seymour CW,et Third

International Consensus Definitions for Sepsis and Septic

Shock(Sepsis-3)[J].JAMA,2016,315(8):801-810.

[2] Fleischmann C,Scherag A,Adhikari NK,et ment of

投稿邮箱:zuixinyixue@

图7 利用Cytoscape筛选关键模块中关键基因,红色为上调基

因,绿色为下调基因

与的。早期诊断及治疗有助于降低脓毒症的死亡率。因

此探索脓毒症发展的相关基因,以期找到新的治疗靶

点,提供有效治疗手段有极为重要的临床及科研意义。

本研究利用基因组学分析方法对于GEO数据库中

脓毒症和正常人的血液芯片数据作了挖掘和分析。与

正常人群比较,脓毒症患者的血液中有显著变化,共发

现281个DEGs,其中上调181个下调101个,reactome

通路分析主要涉及到中性粒细胞脱颗粒,免疫激活和

固有免疫的激活,通路分析中还有T细胞受体瀑布通

路。发现差异显著的通路主要集中在免疫反应方面。

Copyright©博看网 . All Rights Reserved.

242

World Latest Medicne Information (Electronic Version) 2021 Vo1.21 No.22

Global Incidence and Mortality of Hospital-treated Sepsis.

Current Estimates and Limitations[J].Am J Respir Crit

Care Med,2016,193(3):259-272.

[12]  Hole CR,Leopold Wager CM,Mendiola AS,et ngal

Activity of Plasmacytoid Dendritic Cells against

Cryptococcus neoformans In Vitro Requires Expression of

Dectin-3(CLEC4D)and Reactive Oxygen Species[J].Infect

Immun,2016;84(9):2493-2504.

[13]  Sung PS,Huang TF,Hsieh ellular vesicles from

CLEC2-activated platelets enhance dengue virus-induced

lethality via CLEC5A/TLR2[J].Nat Commun,2019,10(1):2402.

[14]  Zhang J,Cheng Y,Duan M,et ing differentially

expressed genes upon regulation of transcription factors

in sepsis[J].3 Biotech,2017,7(1):46.

[15]  El Chemaly A,Nunes P,Jimaja W,et 1 proton channels

differentially regulate the pH of neutrophil and

macrophage phagosomes by sustaining the production

of phagosomal ROS that inhibit the delivery of vacuolar

ATPases[J].J Leukoc Biol,2014,95(5):827-839.

[16]  Herb M,Gluschko A,Schramm 3-associated

phagocytosis initiated by integrin ITGAM-ITGB2/Mac-

1 enhances immunity to Listeria monocytogenes[J].

Autophagy,2018,14(8):1462-1464.

[17]  Zhang Z,Long C,Li X,et -1 promotes myocardial

injury following coxsackievirus infection by regulating

the coxsackievirus-adenovirus receptor[J].Medicine(Balti

more),2019,98(19):e15629.

[18]  Achiron A,Gurevich M,Magalashvili D,et tanding

autoimmune mechanisms in multiple sclerosis

using gene expression microarrays:treatment

effect and cytokine-related pathways[J].Clin Dev

Immunol,2004,11(3-4):299-305.

[3] Reinhart K,Daniels R,Kissoon N,et izing Sepsis as

a Global Health Priority - A WHO Resolution[J].N Engl J

Med,2017,377(5):414-417.

[4] Kumar V.T cells and their immunometabolism: A novel way

to understanding sepsis immunopathogenesis and future

therapeutics[J].Eur J Cell Biol,2018,97(6):379-392.

[5] Boomer JS,Green JM,Hotchkiss changing immune

system in sepsis:is individualized immuno-modulatory

therapy the answer?[J].Virulence,2014,5(1):45-56.

[6] Hotchkiss RS,Moldawer LL,Opal SM,et and septic

Rev Dis Primers[J].2016,2:16045.

[7] Boomer JS,To K,Chang KC,et suppression in

patients who die of sepsis and multiple organ failure[J].

JAMA,2011,306(23):2594-2605.

[8] Kolde R,Laur S,Adler P,Vilo rank aggregation for

gene list integration and meta-analysis[J].Bioinformati

cs,2012,28(4):573-580.

[9] Law CW,Alhamdoosh M,Su S,et -seq analysis is easy as

1-2-3 with limma,Glimma and edgeR[J].F1000Res,2016,5:ISCB

Comm J-1408.

[10]  Angus lingering consequences of sepsis: a hidden

public health disaster?[J].JAMA,2010,304(16):1833-1834.

[11]  Duhan V,Hamdan TA,Xu HC,et cell-intrinsic

FcεRIγ limits CD8+ T-cell expansion and thereby

turns an acute into a chronic viral infection[J].PLoS

Pathog,2019,15(6):e1007797.

(上接第47页)

[8] Wei-jie Guan,Zheng-yi Ni,Yu Hu,et al

Characteristics of Coronavirus Disease2019 in China[J].N

Engl J Med,2020,382:1708-1720.

[9] Nanshan Chen,Min Zhou,Xuan Dong,et iological

and clinical characteristics of 99 cases of 2019 novel

coronavirus pneumonia in Wuhan,China: a descriptive

study[J].The Lancet,2020,395(10223):507-513.

[10]  李梅,汪小五,刘艳,等.新型冠状病毒肺炎患者血清SAA、ESR、

CRP检测结果分析[J].现代生物医学进展,2020,20(10):1949-

1951.

[11]  Yamada, Amyloid A(SAA): a Concise Review

of Biology,Assay Methods and Clinical Usefulness[J].Clin

Chem LabMed,1999,37(4):381-388.

[12]  Li Weng,Yang Jiao,Yue Case of 2019 Novel

Coronavirus in the United States[J].The New England

Journal of Medicine,2020,382(10):929-936.

[13]  Zhang C,Shi L,Wang F injury in COVID-19:

management and challenges[J].The Lancet Gastroenterology

& Hepatology,2020,5(5):428-430.

[14]  Xiaoqiang Chai,Longfei Hu,Yan Zhang,et ic ACE2

Expression in Cholangiocytes May Cause Liver Damage

After 2019-nCoV Infection[J/OL].bioRxiv,2020,:

投稿邮箱:zuixinyixue@

10.1101/2020.02.03.

931766.[Epub ahead of print].

[15]  ZhenyuFan,LipingChen,al Features of COVID-

19-Related Liver Functional Abnormality[J].Clinical

Gastroenterology and Hepatology,2020,18(7):1561-1566.

[16]  靳英辉,蔡林,程真顺,等.新型冠状病毒(2019-nCoV)感染的肺

炎诊疗快速建议指南(完整版)[J].医学新知,2020,30(01):35-64.

[17]  Zhen Li,Ming Wu,Jiwei Yao,et n on

Kidney Dysfunctions of COVID-19 Patients[J/OL].

medRxiv,2020,Feb,:10.1101/2020.02.08.20021212.[Epub

ahead of print].

[18]  Shaobao Shi,Mu Qin,Bo Shen,et ation of Cardiac

Injury With Mortality in Hospitalized Patients With

COVID-19 in Wuhan,China.[J/OL].JAMA Cardiol 2020;Mar

: 10.1001/jamacardio.2020.0950.[Epub ahead of print].

[19]  郭颖,裴作为,朱火兰,等.新型冠状病毒肺炎相关心

肌损伤的临床管理专家建议(第一版)[J].中国循环杂

志,2020,35(04):326-330.

[20]  李力,李琦,程金波,等.新型冠状病毒肺炎患者分层治疗与中

医辅助治疗方案[J].第三军医大学学报,2020,42(04):427-430.

[21]  Zhou F,Yu T,Du R,et al course and risk factors

for mortality of adult inpatients with COVID-19

in Wuhan,China: a retrospective cohort study[J].

Lancet,2020,395(10229): 1054-1062.

Copyright©博看网 . All Rights Reserved.


本文标签: 脓毒症 分析 基因 进行 数据