请问:已经知道FASTA格式的氨基酸序列,怎样找出这段序列所表示的蛋白序列?
进入NCBI 数据库 将此氨基酸序列输入 query senquece 区域, 同时输入你要找的生物物种的名称(你的蛋白是人的?还是大肠杆菌的) 进行blast 便可.
只有FASTA格式的序列,怎么查询其相应分子信息??
通过nucleotide BLAST直接输入FASTA sequence 看一看相似度最高的是哪一家族的基因差不多应该就是了http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE=Nucleotides&PROGRAM=blastn&MEGABLAST=on&BLAST_PROGRAMS=megaBlast&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on
请教一个perl程序,从fasta格式DNA序列中抽出部分感兴趣序列
这个其实很简单,只是逻辑要通顺.我给你perl的解决思路:首先,你要确定你的fasta文件的内容的规律性.比如每段序列的开始是不是都会有一些特殊的标志.那么可以用next函数,将这些不是序列的内容跳过.然后开始读取每一行,将每一…
生物信息学 专业 问题:在NCBI上下载的fasta格式的DNA序列中有异常字符!
有没有可能是 稀有碱基..
fasta,bam和gff格式的文件是用来描述什么类型的数据,每种格式的基本组成是什么
bam 和 gff不是很清楚,fasta知道一点.fasta是基因序列文件,第一行是序列的描述或者名称,用’>’符号开头.然后换行,第二行开始是基因序列,一般DNA的话就是A,G,C,T四种字符组成.有的FASTA第二行是不换行的,有的是换行的.这点需要注意.
怎么把自测序列转换成fasta格式的啊
你试试DnsP软件,将你的序列复制到txt文本,然后直接改文件名为fas,
FASTA文件里面的序列都是正链上的吗
编码链.因为你从ncbi上可以用它的orf搜索工具搜索dna上的orf的.软件识别的是dna序列上的atg和taa\tag\tga的.因此它的dna序列肯定是编码链的.
fasta是什么意思
FASTA程序是第一个广泛使用的数据库相似性搜索程序. 程序引用取代矩阵实行局部比对以获得最佳搜索.但众所周知,使用这种策略会非常耗费工作时,为了提高速度,在实施耗时的最佳搜索之前,程序使用已知的字串检索出可能的匹配.在速度和敏感度之间权衡选择依赖于ktup参数.它决定了字串的大小.增大ktup参数就会减少字串命中的数目,也就会减少所需要的最佳搜索的数目和搜索的速度. 从2.0版本开始,FASTA对每一个检索的比对都提供一个统计学显著性的评估.
如何从NCBI找到基因序列AF308147 AF310622 AF283499 AF012090 AF447394的FASTA格式
http://www.ncbi.nlm.nih.gov/nuccore/AF308147 http://www.ncbi.nlm.nih.gov/nuccore/AF310622 http://www.ncbi.nlm.nih.gov/nuccore/AF283499 http://www.ncbi.nlm.nih.gov/nuccore/AF012090 http://www.ncbi.nlm.nih.gov/nuccore/AF447394 进去后,点击GenBank: 下面的FASTA就可以得到.
如何用Bioperl读取fasta格式的基因组数据
不需要你自己重新来写,单枪匹马,刀耕火种,不是一个好的办法. 正好我也在做bioinformatics这块儿,学了点bioperl,我帮你写了个小脚本,用这个工具能