2
栏目分类
热点资讯
5色吧 你的位置:成濑心美番号 > 5色吧 > 开心色五月 干货 | 怎样进行测序物种参考基因组的查找和评估
开心色五月 干货 | 怎样进行测序物种参考基因组的查找和评估 发布日期:2024-12-19 04:09    点击次数:169

开心色五月 干货 | 怎样进行测序物种参考基因组的查找和评估

合理的参考基因组版块对转录组神态分析尤为紧迫。跟着高通量测序期间的发展,物种的参考基因组版块越来越多,那么,团结物种不同版块参考基因组该怎样礼聘呢?今天小编来注目先容一下在作念特定物种的转录组测序前开心色五月,怎样进行参考基因组的查找和评估。

 

怎样查找?

常用的数据库主要有NCBI、Ensembl和JGI三种数据库。底下咱们以步地物种小鼠(Mus musculus)为例阐述。

 

一、NCBI数据库

NCBI(National Center for Biotechnology Information)是好意思国国立卫生盘考院(NIH)的国立医学藏书楼(NLM)的一个分支。NCBI检索系统收录了好多基因序列和卵白序列数据库。具体查找操作门径如下:

 

1、掀开NCBI(https://www.ncbi.nlm.nih.gov),礼聘下拉要求“Genome”并在搜索框中填写所需要查找基因组的物种(Mus musculus[orgn]),点击搜索。

 

2、下图框定的实质为评估物种参考基因组需要的信息文献,点击即可下载。

 

二、Ensembl数据库

Ensembl是由 European Bioinformatics Institute(EBI)与Wellcome Trust Sanger Institute(WTSI)共同伙同配置的数据库神态。涵盖大齐物种的参考基因组信息,何况数据更新实时。具体查找操作门径如下:

 

1、掀开Ensembl( )网站主页, 找到标注为“All genome”的物种选项。若物种为植物,则对应网站为Ensembl Plant()。

 

2、如图所示位置礼聘需要下载的物种。

 

3、下图框定的实质为评估物种参考基因组需要的信息文献,点击下载即可。

 

三、JGI数据库

部分植物和真菌基因组可在JGI数据库(https://genome.jgi.doe.gov/portal/)中查找。

 

蕾丝 百合 调教

四、其他数据库

1、GigaDB数据库(#myCarousel)

 

2、国度基因组生命大数据库(https://db.cngb.org/)

 

3、plaBi数据库(https://www.plabipd.de/index.ep)

此数据库内部纪录了已测序了的植物以及发表的著作。把柄植物分类来查找具体发表的文献。

 

怎样评估?

在掌抓了参考基因组查找下载门径之后,接下来咱们注目先容下载后的参考基因组信息的评估门径。

 

一、拼装方向

1、拼装水平

以水稻(Oryza sativa)基因组为例,在首页下拉要求礼聘“Assembly”并在搜索框中填写物种称号进行搜索。跳转页面会出现不同版块基因组的拼装水平,一般来说拼装水平越接近染色体拼装效力越好(Complete Genome > Chromosome > Scaffold > Contig)。

 

2、拼装门径

对一条染色体进行测序,将测序获取的reads进行拼接,或者彻底拼接起来,中间莫得gap的序列称为contig。将测序获取的所有contig从大到小进行摆设,当其长度达到染色体长度的一半时,这一条contig的长度就叫作念contig N50。咱们不错用这个数值评估序列拼装质料,值越大,拼装效力越好。2018年以来,跟着Pacbio 和 Oxford Nanopore Technologies(ONT)新期间的兴起,大大普及了基因组拼装质料。一般来说,诓骗以上两种期间拼装出的基因组较好(contig N50 > 1Mb)。

 

二、GFF/GTF文献评估

GFF(general feature format)主若是用来谛视基因组。而GTF(gene transfer format)主若是用来对基因进行谛视。下载GFF/GTF文献,用Notepad软件(https://notepad-plus-plus.org/downloads/)掀开。仔细查验GFF文献,若泄露有exon和CDS信息,则基因组谛视相对彻底,可用于分析;若exon和CDS缺失,阐述该基因组谛视不完好,需等完好谛视信息进一步完善后才可分析。

 

三、序列一致性评估

通过reads比到基因组上,考据reads对基因组的阴事情况,用于评估拼装的完好性以及测序的均匀性。较高的mapping rate(90%以上)觉得拼装结果和reads有比拟好的一致性。如果物种仅有genome,莫得transcript和GFF文献,标明唯有基因组序列,无法作念完好成例有参, 一般是先作念基因组比对,比对率达到70%以上,基于比对到基因组上的序列进行转录本拼装,对拼装的转录本进行谛视,定量,各别和富集分析。

 

以上为查找和评估的参考门径提议,神态实施以生信分析工程师详尽评估版块为准。

 

文末彩蛋

看到这里还莫得达成哦,当今越来越多的SCI期刊在著作发表时开心色五月,要求提供原始数据在各人数据库中的登录号。在520到来之际,欧易生物“宠你更懂你”。  5月20日19:00 在易明学院由 高档生信工程师 徐天生 为诸君诚笃带来“高通量测序数据上传” 讲座。扫描下方二维码即可参预易明学院课堂界面,讲座贵寓今日会上传到欧易转录调控QQ相似群(746716637)中。