大肠杆菌的gff文件 鸡大肠杆菌

http://www.sequenceontology.org/gff3.shtmlftp://ftp.ncbi.nlm.nih.gov/genomes/Bacteria/Escherichia_coli_042_uid161985/

一、gff文件中重要的feature我们主要需要:gene、CDS、region、exon、tRNA、rRNA、ncRNA。

在细菌里一般重要的exon是gbkey=misc_RNA的exon。在做的过程中,把不是misc_RNA的exon记录一下,写到一个log文件里。

gbkey=misc_RNA的exon和那几个RNA,都可以我们自己做个分类叫RNA。可以把这个RNA组成一个trackgroup,其中每个是一个track。

region主要是对CDS描述的比较多。region描述CDS中功能区域,例如跨膜区,结构域等注释信息。这些也比较重要。region主要是被注释的功能信息,pfam等


exon主要记录除了编码蛋白和已知的一些rna外的其他misc-rna,但是如果要处理exon的话,就要把gff文件的最后一列做详细处理,把可能的rna描述提取出来
我们在提供browse注释的时候,不可能告诉使用者,某段序列是个exon,而要告诉他们这段序列是XXRNA。
一般都是 gene-->rna/transcript-->exon?
例子:
大肠杆菌的gff文件 鸡大肠杆菌
NC_017627.1RefSeqgene8279482889.+.ID=gene97;Name=finP;Dbxref=GeneID:12703501;gbkey=Gene;gene=finP;locus_tag=EC042_pAA161
NC_017627.1RefSeqtranscript8279482889.+.ID=rna0;Parent=gene97;Note=antisenseRNAoftraY-ZmRNA;Dbxref=GeneID:12703501;gbkey=misc_RNA
NC_017627.1RefSeqexon8279482889.+.ID=id176;Parent=rna0;Note=antisenseRNAoftraY-ZmRNA;Dbxref=GeneID:12703501;gbkey=misc_RNA

二、利用gff文件解释细菌的基因组情况,我们分成三个层次做track:

gene作为一个层次;

转录层包括那一堆RNA,CDS;

注释层包括region的一些注释信息。

例子:

7627.1RefSeqregion8240482718.-.ID=id175;Note=HMMPfamhit to PF00989, PAS, score2.3e-20;Dbxref=GeneID:12703500;gbkey=misc_feature

这个例子表明,此区域为一个pfam结构域。以及计算打分score都在。

三、exon的二级parent结构例子:NC_017627.1 RefSeq gene 82794 82889 . + .ID=gene97;Name=finP;Dbxref=GeneID:12703501;gbkey=Gene;gene=finP;locus_tag=EC042_pAA161
NC_017627.1 RefSeq transcript 82794 82889 . + .ID=rna0;Parent=gene97;Note=antisense RNA of traY-ZmRNA;Dbxref=GeneID:12703501;gbkey=misc_RNA
NC_017627.1 RefSeq exon 82794 82889 . + .ID=id176;Parent=rna0;Note=antisense RNA of traY-ZmRNA;Dbxref=GeneID:12703501;gbkey=misc_RNA

其中,exon的parent=rna0
transcript的ID=rna0
transcript的parent=gene97这是二级parent
这个exon和transcript都是gene97的
exon是孙子

  

爱华网本文地址 » http://www.aihuau.com/a/25101010/40989.html

更多阅读

如何清理C盘的垃圾文件 win8电脑c盘怎么清理

如何清理C盘的垃圾文件?很多网友都会有这样的疑问,那么今天就和大家来分享下如何清理C盘的垃圾文件,请看下文:1、360的小工具里有个软件搬家功能 把你的软件和大的文件都移到其他盘。?2、首先你的C盘空间是多大的,还有你是否经常将软件

酷狗的皮肤文件存放在哪 酷狗皮肤图片

酷狗的皮肤文件存放在哪——简介为了吸引用户,播放器一般都制作了精美的皮肤文件。有很多人都很喜欢这些皮肤,甚至想要“据为己有”,问题是酷狗的皮肤文件存放在哪儿了。好的,现在我就带领大家去寻找美丽的皮肤。以我在百度知道上遇到的

如何打开win7系统IE的缓存文件夹? ie缓存文件夹在哪

如何打开win7系统IE的缓存文件夹?——简介下边给出打开win7系统IE缓存文件夹的方法,希望能帮助到大家呵呵!!如何打开win7系统IE的缓存文件夹?——工具/原料win7 如何打开win7系统IE的缓存文件夹?——方法/步骤如何打开win7系统IE的缓存文

不可预料的压缩文件末端怎么解决? 不可预料的压缩文件

不可预料的压缩文件末端怎么解决?——简介有时候我们下载文件解压的时候会出现不可预料的压缩文件末端怎么解决,小编今天就遇到这个问题了,就是报错,辛苦下载的文件就不能用了,能否用办法解决呢?其实有方法的,看小小编是怎么解决的。不可

声明:《大肠杆菌的gff文件 鸡大肠杆菌》为网友亽菋分享!如侵犯到您的合法权益请联系我们删除