乌苏里拟鲿SNP标记的开发

 2023-09-05 09:09

论文总字数:28319字

摘 要

乌苏里拟鲿(Pseudobagrus ussuriensis)是近年兴起的新型名优养殖鱼类。鉴于乌苏里拟鲿SNP标记匮乏的现状,本研究利用转录组高通量测序来进行SNP标记开发。转录组测序共获得257543个SNP位点,其中C/T位点数目77132个,A/G位点78507个,A/T位点29493个,A/C位点26928个,T/G位点27020个,C/G位点有18463个。以上研究结果对于丰富乌苏里拟鲿分子标记类型、阐明免疫防御分子机制、探究种群遗传多样性和保护种质资源均具有重要意义。

关键词:乌苏里拟鲿,转录组,高通量测序,SNP标记,多态性分析

Abstract: Pseudobagrus ussuriensis is a new type of famous and excellent cultured fish in recent years. In view of the lack of SNP markers in P. ussuriensis, high throughput sequencing was used to develop SNPs in this study. A total of 257543 SNP loci were obtained by sequencing, including 77,132 C/G loci, 78,507 A/G loci, 29,493 A/T loci, 26,928 A/C loci, 27,020 T/G loci and 18,463 C/G loci. The above results are of great significance for enriching the types of molecular markers, expounding the molecular mechanism of immune defense, exploring the genetic diversity of the population and protecting the germplasm resources.

Keywords: Pseudobagrus ussuriensis, high-throughput sequencing, transcriptome, SNP markers, polymorphism analysis

目 录

1 前言 6

1.1 乌苏里拟鲿概述 6

1.2 SNP概述 6

1.3 研究目的 7

2 材料与方法 7

2.1 实验材料 7

2.2 RNA的制备、文库构建和转录组测序 7

2.3 转录组的重新组装、功能分类和注释 7

2.4 SNP标记的搜索 8

2.5 SNP特征分析 8

2.6 SNP的PCR引物设计 8

2.7 SNP标记突变位点 8

3 结果与分析 8

3.1 转录组分析结果 8

3.2 Unigene注释结果 10

3.3 转录组SNP分析结果 11

3.4 SNP引物设计 12

4 讨论 15

结 论 17

参 考 文 献 18

致 谢 19

附件1 乌苏里拟鲿用于SNP标记基因序列 20

1 前言

乌苏里拟鲿概述

乌苏里拟鲿分布在我国东北的乌苏里江、松花江、黑龙江等水域。它属于鲶形目,鲿科,拟鲿属。体延长,前部粗圆,后部侧扁。头顶有皮膜覆盖,上枕骨棘几乎露出,眼睛小,被皮膜且无鳞,鼻孔前后分离。乌苏里拟鲿的鱼肉细嫩可口,营养丰富所以这种鱼的市场评价比较高,。近年来随着市场需求不断增加,乌苏里拟鲿的捕捞量也因此逐年剧增,以至现在在其原产水域资源将面临衰竭而成为稀有的物种,现已被黑龙江省列为重点研究开发增养殖的土著优质鱼类,目前在很多自然分布区已很难捕获野生个体[1]

SNP概述

SNP是由基因组的DNA序列中单个核苷酸的替换产生的,其中最普遍存在是两种类型的突变:颠换(A,G与T,C互换)和转换(A/T,A/C,G/T,G/C互换)。在生物体中的SNP常由2个等位基因组成,因此它被称为二等位基因分子标记。在对基因分型的时候,我们通常不对DNA片段的长度分析而对SNP进行 ,-的分析,这对我们通过高通量技术来筛选或者检测SNP有好处[2]。在有些情况下,同是等位基因系统比如SSR应用会比SNP更适合。但由于在基因组中SSR的分布没有SNP广,不能通过较多的位点,还得要通过加大其分布的密度来弥补不足。除此之外,当前在描述SNP时而不是用等位基因,更倾向更严谨的单倍型。如果考虑由多个单碱基位点变异所构成的单倍型时,SNP所含的信息量就很巨大了。

SNP标记的开发一般有两种方法。第一种是直接对DNA扩增的片段进行测序。它是根据单拷贝的基因组序列或者EST来设计引物,从中选取一些对象进行DNA扩增,先对扩增出来的产物完全测序再通过序列比对软件比对。第二种就是用生物信息学方法从DNA序列数据库(如NCBI)开发SNP。上述提到的数据库中存储的DNA序列数量将会随着人类的发展以及相关研究的陆续开展而快速增长,这也成了搜寻SNP的重要途径。采用先进的生物信息学软件自动识别已经成为一种简单有效且廉价的发掘SNP的新策略[3]

1.3 研究目的

因为SNP标记不仅能让研究者更容易地进行基因分型,而且它的稳定性又相当不错,这使它将成为既有效且应用最广泛的分子标记之一。SNP标记的开发为将来的基因功能、基因表达调控模式等研究提供了跟踪标志。本实验对乌苏里拟鲿SNP标记研究结果有利于丰富乌苏里拟鲿分子标记类型、阐明免疫防御分子机制、探究种群遗传多样性和保护种质资源。

2 材料与方法

2.1 实验材料

实验用的乌苏里拟鲿为人工繁育的鱼苗,2018年5月于实验室培育出,之后在室内水循环系统中养殖,暂养溶氧为(5.23±0.55) mg/L,水温为(25.0±1.0)℃,pH为7.20±0.05,湿度为88,分别于早上9:00及下午16:00投喂为具有浮性的配合饲料,每日投喂量为体质量的4%,投喂之后及时地捞去残饵和粪便。实验开始的前一天停止投喂饲料,实验前测得的鱼体长为(8.00±0.10) cm,体质量为(4.90±0.10) g。取肝脏、鳃、脾脏、肾脏、皮肤组织置于液氮中保存备用。

2.2 RNA的制备、文库构建和转录组测序

利用Trizol法提取各样本总的RNA,提取完成后,先将各RNA样品进行琼脂糖凝胶电泳质量检测,然后用纳米试剂盒进行RNA降解程度检测。接着用磁珠富集真核生物的mRNA方法选出cDNA片段,接着将3 μL的用户酶和所选大小的接头连接的cDNA的混合物在37°C的条件下酶切15分钟,然后在95°C条件下处理5分钟,使酶失活。接着进行了聚合酶链反应(PCR)扩增反应,然后我们分析后在Illumina HiSeq 2500平台上对每个cDNA库进行高通量测序,并对生成的末端进行读取。

2.3 转录组的重新组装、功能分类和注释

我们使用了Trinity平台将高质量的序列用于转录本拼接,其主要分为三个过程:第一步,我们先分解reads,构建成k-mer (k=25)库;第二步,进行了选择了基因进行延伸,形成了contig;第三步,将有重叠的contigs的聚集物,构成components。然后将每个component简化为转录本,进行对比分析对应的旁系分支的同源的转录本,最后得到拼接结果,并将其命名为Trinity.fasta。我们把其中一个基因中最长的转录部分认为是单基因。最后在数据库中对单基因的功能进行了注释:Nr、Nt、pfam、KOG、Swiss Prot和GO。

2.4 SNP标记的搜索

我们先对结果进行染色体坐标的排列顺序,之后去除了重复的一系列读数,后进行了SNP查找分析,样本过滤后得到了分析的结果,每个样本的基因表达水平由RSEM估计[5]。之后用DEGseq进行差异分析,其中Q值lt;0.005和|log2(倍数变化)|gt;1的就是设定的显著差异基因表达的阈值。

2.5 SNP特征分析

在转录组得到的基因组数据库中发现SNP位点共计257543个,发生频率为2.98/kb,转换155639个,颠换101904个。六种单核苷酸变异中转换类型中发生频率最高的A/G(占31%)和C/T(占30%);而另外4种颠换类型的SNP中C/G占总数的7%、G/T占总数的11%、A/C占总数的10%和A/T占总数的11%。由此可看出转换类型明显高于颠换类型,在转换类型中A/G的发生频率较高而A/G和C/T的发生频率基本相同。

2.6 SNP的PCR引物设计

根据转录组结果得到的SNP Calling中挑选40个序列并利用primer 5.0进行PCR引物设计操作,在突变位点的上下游选择评分最高的引物。

PCR引物设计要求引物要在模板的目的位点并与模板序列互补,而且引物之间不能形成二聚体。同时,在引物设计时还要考虑到别的因素,比如序列的 Tm值,引物及产物的长度等。

2.7 SNP标记突变位点

经PCR测序后再从测序峰图寻找清晰可见、有明显双峰的位点, 并定其为SNP 位点

剩余内容已隐藏,请支付后下载全文,论文总字数:28319字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;