admin 管理员组

文章数量: 1087135


2024年4月15日发(作者:oracle视图触发器)

2023年第23期现代园艺

耐盐碱粗根茎莎草高通量测序及生物学信息分析

苗小荣

1

,唐柳茹

1

,黎东海

1

,张小艳

1

,王慧茹

1

,牛俊奇

1,2*

广西玉林

(1玉林师范学院生物与制药学院,537000;2玉林师范学院广西高校亚热带生物资源保护与利用

重点试验室,广西玉林537000)

摘要:粗根茎莎草是海岸沙丘生态系统的重要组成部分。为了解析自然生长条件下粗根茎莎草基因表达情况,采用高通量测序

茎和叶混合样品进行转录

组测序分析。结果显示,技术,对海滨自然生长的粗根茎莎草的根

粗根茎莎草一共获得高通量测序数据

8.44Gb,Q30大于92.45%;获得27276个Unigene基因,平均长度为1103.12bp,N50长度1763bp,GC含量44.71%;在NR、

Swiss-Prot、Pfam、COG、GO和KEGG分别注释到17932、14080、14215、16703、15387和7705个Unigene基因;有21419个CDS序

筛选到

242个环境适应基因

,其

中列,其中有2476个CDS序列长度大于1800bp;有617个转录因子和10945个SSR位点;同时

与逆境胁迫相关基因96个,与耐盐碱相关基因25个。本研究结果为今后开展粗根茎莎草耐盐碱基因的筛选和功能鉴定奠定了理

论基础。

转录组;功能注释;耐盐碱

关键词:粗根茎莎草;高通量测序;

海岸沙丘是由悬崖和悬崖侵蚀产生的海洋沉积物

逐渐堆积而成的,是连接陆地和海洋生态系统的过渡

生态系统不稳定,容易

受环境。其显著特点是营养低

泥沙淤积和侵蚀、

海岸线退化、盐化、沙质结构磨损

水分、养分有效性、土壤温度、草食性和人为干扰等因

素影响,而海岸盐生植物是稳定海岸沙丘的有效自然

手段。粗根茎莎草()是莎草科植物,

是海岸沙丘生态系统的重要组成部分,能生长在0.2%

~0.4%盐碱条件,主要分布于我国东南沿海沙滩上,但

课题组前期试验结果表明,在内陆湿生或半干旱环境

条件下也能正常生长,因其生长速度快,地上地下部分

能有效防止水土流失

[1]

。同交错生长,且种群密度大

时,喜生于盐碱条件,已被我国盐生植物种质资源库

《中华

海(/)收录,同时也被

2卷海洋矿物药与海洋植物药收录

,也是

一洋本草

种重要的药用植物。主要用于治疗胸闷不舒

、月经

子宫内膜异位症和胃食管异

调、痛经、风疹瘙痒、胃痛、

位症等相关疾病

[2]

逆境胁迫是影响植物生长发育的环境因子之一

当植物受到胁迫时,首先在转录水平上诱导相关基因

表达,翻译成蛋白质,通过酶调控相关代谢途径,以应

对逆境造成的损伤

[3]

。植物在长期的进化过程中,形成

了各种各样的复杂逆境适应机制,因此可以从转录水

平揭示植物响应盐胁迫的分子调控机制

[4]

。粗根茎莎

草的块茎,形似香附子的块茎,具浓烈芳香气味,目前

仅对其挥发性成分进行了鉴定

[5]

,而粗根茎莎草其他方

面的研究尚未见有报道。因此,本研究采用高通量测序

2021GXNSFAA196061)基金项目:广西自然科学基金项目;大学生

创新训练项目(S2、2)共同资助。

1983-)

硕士,副教

授,

作者简介:苗小荣,女,汉族,河南汤阴人

究方向:园艺作物分子生物学

通信作者:牛俊奇(1983-),男,汉族,河南汝州人,博士,副教授,硕

士生导师,研究方向:甘蔗生长发育与分子生物学。

技术,对粗根茎莎草进行转录组(RNASequencing,

RNA-Seq)测序,

通过与

GO、KEGG、eggNOG、NR、

Swiss-Prot和Pfam数据库进行比对,获得大量的注释

Unigene基因,这对今后开展粗根茎莎草耐盐碱基因的

筛选、鉴定和功能研究奠定了理论基础。

1材料与方法

1.1试验材料

本研究以2022年10月3日取材于海南省万宁市

石梅湾

(东经

110°11′18.42″、北纬22°39′

35.3874″)的粗根茎莎草为试验材料,利用无菌水将

无病虫害污染的粗根茎莎草的根、茎和叶清洗干净,将

样品剪碎混匀后,采用液氮冷冻,-80℃保存,用于提

取总RNA。

1.2RNA提取和测序

的方法和

按照植物RNA提取试剂盒(康为世纪

步骤,从粗根茎莎草的混合样品中提取RNA。经过检

浓度和质量都符合

测RNA电泳条带无降解、无弥漫

高通量测序要求。高通量测序由上海美吉生物医药科

测序平台为

IlluminaNovaseq6000。技有限公司完成,

1.3转录数据分析

将测序获得Unigene序列与NR、Swiss-Prot、Pfam、

COG、GO和KEGG等六大数据库进行比对,进行基因

注释,同时对组装获得的序列进行CDS、SSR和转录因

子进行分析。

2结果与分析

2.1转录测序结果和Unigene注释分析

一共获得了

57382644个原高通量测序结果表明,

始测序(Rawreads)数据。经序列过滤后,共获得

Cleanreads)56964552个质控后测序数据,测序质量

Q20和Q30分别为97.4%和92.45%,说明测序、组装

和拼接质量较好。同时,获得8.44Gb高质量碱基,有

27276个Unigene,38755个Transcription,平均长度为

訛輯輥

现代园艺2023年第23期

表1粗根茎莎草Unigene功能注释分类

数据库

注释基功能注释注释基因功能注释

因数量占比/%

数据库

数量占比/%

GO1538757.57NR1793267.09

KEGG770528.83Swiss-Prot1408052.68

eggNOG1670362.49Pfam1421553.19

1103.12bp,N50长度为1763bp,GC含量44.71%。

将27276个Unigene基因与六大数据库进行比对

注释,结果如表1显示

,在

NR、KEGG、Swiss-Prot、

Pfam、GO和eggNOG数据库分别注释到17932个、

7705个、14080个、14215个、15387个和16703个,注

释率分别为67.09%、28.83%、52.68%、53.19%、

57.57%;和62.49%。其中在NR数据库中获得注释的

基因最多,而在KEGG数据库中注释到的基因最少。

2.2CDS序列长度分析

从粗根茎莎草转录数据库中一共检测到21419个

CDS序列(

1),其中序列长度在201~400bp的CDS

序列最多

,有

5342个,占比24.94%,其次是401~600

bp的CDS序列

,有

2694个,

占比

12.58%,而在

1601~1800bp的CDS序列最少

,有

727个,占比

3.40%。此外还有2476个CDS序列超过1800bp。

图1粗根茎莎草CDS序列长度分析

2.3KEGG通路分析

从KEGG数据库一共注释到5289个Unigene功

訛輰輥

图2粗根茎莎草CDS序列长度分析代谢类型

能基因,包括环境适应、碳水化合物

、脂质、能量等

20

种代谢类型

(图

2)。其中,与碳水化合物代谢相关的基

因最多

,有

567个,其次是与翻译相关的基因

,有

522

个,最少的是与病毒信息处理相关的基因,仅有30个。

此外,还发现与环境适应相关的基因有242个

,其

中包

括逆境胁迫相关基因,如过氧化物酶、脯氨酸、超氧化

物歧化酶等96个,而与耐盐碱相关基因有25个。

2.4eggNOG和COG功能注释

eggNOG数据库比对结果表明,

粗根茎莎草共有

64192个Unigene被注释。在生物过程中起作用的有

21种Unigene,

22946个基因,其中参与生物调节的

基因有2336个;在细胞组分中起作用的有12种Uni-

gene,

23434个基因,其中细胞成分Unigene基因数

目最多

,有

7169个,其次是膜部件成分相关基因

,有

5342个

在分子功能中起作用的有16种Unigene,

17812个基因,其中包括抗氧化活性90个,营养活性8

个和毒素活性的基因3个。

而在COG功能数据库中,一共注释到17693个

Unigene基因,可以分为23类,其中与信号转导相关基

因的有1062个,占比6.0%;与转录相关的基因为920

个,占比5.20%;与翻译后修饰、伴侣和蛋白质周转相

关的基因,有1256个,占比7.10%;功能未知的基因数

目最多

,有

9317个,而与细胞核结构相关的基因最少

仅有1个。

2.5NR数据库相似度和物种匹配分析

NR数据库注释结果表明,粗根茎莎草与康藏嵩

草、油棕榈树、菠萝、海枣等植物都有同源序列

(图

3)。

其中,与粗根茎莎草同

源序列数量最多的是

莎草科的康藏嵩草,

比75.44%;其次是菠

萝,占比5.58%;与油

棕榈树和海枣的同源

序列较少,分别为

1.85%和1.64%,而与

其他物种的同源序列

图3粗根茎莎草NR数据库注释物

占比15.83%。

种分布

2.6SSR和转录因子分析

MISA软件分析结果表明,从粗根茎莎草转录数据

库中一共检测到6种类型的SSR位点10945个(

2)。双核苷酸、四核苷酸和五核苷酸SSR位点分别有

1662个、866个和362个。其中SSR重复类型最多是

单核苷酸

,有

5097个,其次是三核苷酸重复类型

,有

2726个,前二者占比80.48%,是主要的类型,而最少的

是六核苷酸重复序列,只有272个,占比2.49%。说明

2023年第23期

表2粗根茎莎草转录数据SSR的类型和频率

数量

5097

1622

2726

866

362

272

10945

比例/%

46.57

14.82

24.91

7.91

3.31

2.49

100

SSR种类

单核苷酸

双核苷酸

三核苷酸

四核苷酸

五核苷酸

六核苷酸

合计

现代园艺

核糖核酸(RNA)是细胞和生物体中重要的一类生

物分子,代表了被转录或表达的基因的种类和数量,存

在多种类型的RNA,如mRNA、tRNA和rRNA等,它们

都在基因表达中发挥重要作用

,并最终将基

因型与表

型联系起来

[7]

。随着下一代测序(NGS)技术的出现,

采用高通量测序已经成为获得转录水平数据的首选

转录测序具有

精确性方法

[8]

。与全基因组测序相比

本低的优点。

白水平和高、目前,主要从转录水平

代谢水平研究基因的表达调控,其中转录调控是生物

体最重要的调控方式之一

[9]

。粗根茎莎草具有耐盐碱

特性,本研究从转录数据库筛选到21419个CDS序

列,其中有242个适应环境条件相关基因,后续将从中

筛选和分离耐盐碱基因,并对其进行功能鉴定,这对今

后通过基因工程技术改良和培育耐盐作物新品种具有

重要意义。

(收稿:2023-03-03)

参考文献:

[1]黄煜,李海生,伍凯瀚,等.惠州平海湾沿海沙滩沙生植被资源现状

研究[J].生态科学,2022,41(03):72-81.

[2]ChauN.M.,HanhT.T.H.,LuyenN.T.,onesandstilbenes

fromCyperusstoloniferusRetz[J].BiochemicalSystematicsandEcology,

2013,50:220-222.

[3]LuK,WeiL,LiX,-genomeresequencingrevealsBrassica

napusoriginandgeneticlociinvolvedinitsimprovement[J].Nature

Communication,2019,10(1):1154.

[4]刘晨,徐浩博,斯钰阳,等.基于转录组学的植物响应盐胁迫调控机

制研究进展[J].浙江农业学报,2022,34(04):870-878.

[5]杨虎彪,李晓霞,白昌军,等.海南产粗根茎莎草挥发油化学成分的

GC-MS分析[J].热带作物学报,2012,33(06):1131-1133.

[6]夏玲,严辉,郭盛,等.经典名方中香附的本草考证[J].中国试验方剂

学杂志,2022,28(10):159-166.

[7]BuccitelliC,,proteinsandtheemergingprinciples

ofgeneexpressioncontrol[J].NatureReviewsGenetics,2020,21(10):

630-644.

[8]刘欢,黄丽娜,张奋强,等.RNA-Seq高通量测序技术在果树功能基

因组学研究的应用进展[J].生物技术进展,2017,7(2):144-148.

[9]吴倩,张磊,黄志平,等.转录组测序及其在野生大豆基因资源发掘

中的应用[J].大豆科学,2013,32(6):845-851.

参考文献:

[1]侯鸣.杜鹃红山茶的栽培与繁殖[J].湖南林业,2009(8):29.

[2]何泉泉,熊智,郑希,等.山茶花的化学成分研究[J].中药材,2019(10):

2297-2301.

[3]曹义苗,高宏旗.不同产地的山茶花提取液中活性成分及抗氧化能

力的研究[J].广东化工,2020(7):65-66+81.

[4]温玲蓉.荔枝叶活性成分鉴定及其生物活性研究[D].广州:华南理

工大学,2013.

[5]HalliwellB,GutteridgeJ,dicals,antioxidants,andhuman

Disease:wherearewenow[J].TheJournalofLaboratoryandClinical

Medicine,1992,119(6):598.

[6]idantsinhumanhealthanddisease[J].AnnualRe-

viewofNutrition,1996,16(1):33-50.

[7]申芮一.茶多酚在食品贮藏保鲜中的应用研究进展[J].食品工程,

2017,(4):12-13.

[8]李慧娟,程佶星,蔡美丽,等.茶多酚在食品保鲜中的应用研究进展

[J].现代食品,2021,(6):17-21.

[9]王颖,杜易潼,薛婉玉,等.植物源性天然抗氧化剂的机理及其在食

品保鲜中的应用[J]中国调味品,2023,(1):204-209.

粗根茎莎草具有较丰富的SSR重复类型

转录因子预测结果表明,在粗根茎莎草转录数据

分布于

32个转录因库中一共鉴定到617个转录因子,

子家族中,其中转录因子数量最多是MYB家族,有86

个;AP2/ERF家族次之,有64个;其次是GRAS、C2H2

和NAC家族分别有56个、46个和44个;最少的是

S1Fa-like家族,只有1个。

3讨论

粗根茎莎草生长于我国东南沿海沙滩上,其块茎

可以随着海洋洋流运动而进行传播,经过海水长时间

块茎就萌发。粗根茎莎

浸泡,当遇到合适的环境条件

草属于莎草属球形块茎莎草组

,其典型特征是具有匍

匐根状茎和块茎,分布于我国的该组植物还有疏鳞莎

线状穗莎草(西双版纳)和

草(云南镇雄县和勐腊县)、

香附子等,其中香附子的块茎还是一味重要的中药材。

很容易混淆,但其

药效粗根茎莎草的块根与香附相似

与香附相差甚远,目前主要通过性状、显微结构和理化

性质对二者进行鉴别

[6]

。基于转录测序数据是开发SSR

分子标记的重要途径,本研究共获得10945个粗根茎

莎草SSR位点,这为将来设计和开发SSR分子标记引

物,利用分子技术鉴定粗根茎莎草和香附子提供了参

考基因序列

(上接第10页)

过程中容易发生氧化和滋生微生物

等,产生异味、酸败等变质现象,严重影响食品的品质,

甚至会产生对人体有害的物质,因此现在在食品保鲜

研究中出现了利用抗氧化剂来解决此类情况,而植物

提取液既天然又能起到抗氧化作用的物质,

在食品保

鲜的研究应用中就显得十分重要

[7-9]

。不少国内外的学

者研究显示,山茶花的化学成分有明显的抗氧化等作

[2-3]

。因此,本试验选取了杜鹃红山茶叶片作为原料,

在本试验的中杜鹃红山茶叶片提取液的最佳提取工

艺:水提法为料液比1∶400、提取时间60min、提取水

浴温度50℃,在该提取工艺下杜鹃红山茶叶片提取液

对DPPH清除率达到了83.89%;醇提法为乙醇体积分

数的60%、料液比1∶200、提取时间40min、提取水浴

(收稿:2023-02-08)

温度40℃。

訛輱輥


本文标签: 基因 根茎 测序 转录 相关