跳至正文

fasta格式的优点,如何将测序结果制成fasta格式

fastqc如何在windows环境下fastq

fastqc如何在windows环境下fastq

方法/步骤进入NCBI主页,选择Nucleotide数据库

在Nucleotide数据库的检索框中输入甘油醛-3-磷酸脱氢酶基因的基因名(GAPDH)或者基因的GenBank号:X02662.1。点击搜索。在右边Top Organisms中选择物种来源,点More可以显示更多隐藏选项

选择所需要的物种信息

GenBank会根据设定的检索条件得出相应结果,选择所需要的序列

点击相应序列打开详序列的细信息,默认为GBFF(GenBank Flat File)格式文件。主要包括以下三部分组成:第一部分:描述符,其中包含了关于整个记录的信息;第二部分:特征表,包含了注释这一记录的特性;第三部分:核酸序列本身;在最后一行以“// ”结尾

在这里也可以选择FASTA格式。

FASTA格式又称Pearson 格式

特点:最常用、最简单的序列注释格式

命名规则:

1、以大于号“>”起始

2、 标题行(a single-line description) 位于文件的第一行

3、 序列行随后,序列行中不允许有空间,每行文字不超 过80个字符

4、组成序列信息字符串的符号应为IUB/IUPAC(International Union Of Pure And Applied Chemistry)核苷酸或氨基酸的符号

5、核苷酸字符大小写均可,氨基酸字符应大写

6、”-“单个连字符表示一个空位 “gap”

7、序列中不允许有数字、不明确的核苷酸用N表示,氨基酸用X表示

8、 氨基酸序列中“*”表示终止

导出序列时点击Send to

在弹出的窗口选择文件单选按钮

在下拉框中选择你需要的文件格式

点击创建文件即可开始下载,下载后的文件可以通过任意文本编辑软件打开。由于NCBI上的文件采用的是Unix/Linux文本格式,而Unix系统里,每行结尾只有“<换行>”,即“\n”;但Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”,在用记事本等软件打开时每行结尾有一个黑方框,这里只需用兼容Unix/Linux文本格式的编辑器打开即可

用什么方法可以预测dna序列是否可以形成茎环结构

用什么方法可以预测dna序列是否可以形成茎环结构

生物信息学各个领域中的数目庞大,在EBI 1997年的分子生物学程序目录中就收录了530多种常用。

序列比对和数据库搜索有BLAST,FASTA,BLITZ等;

综合序列分析有VCctor NTI Suite,DNA Tools,Omiga,DNASIS等;

与蛋白质分析有关的程序有AnthePro,AminoXpress,DSSP等,大型分子生物学包如GCG。并行算法、遗传算法、面向对象算法等已被应用到最新的程序中。

生物研究者期望通过他们的知识,从文献中得到的信息以及他们的经验来对基因预测的分析数据进行解释,由此来进行设计和实施实验,并对他们的解释进行确证、改进或反驳。因此,可以促进实验设计的序列分析有明显的优点。在如此众多的生物面前,什么是生物学研究者所期望的、有帮助的、高效率的序列分析?一般要求这些可以提供基因的预测、重复序列的鉴定、限制酶分析、引物设计、在线序列比对、质粒作图、结构域(motif)查找、RNA二级结构预测、克隆策略图谱、三维结构显示等方面的内容;并且要求的算法简洁、效率高和可移植性好[3]。目前Web站点可以对基因序列提供计算前的分析,并且这些站点允许使用者到客户机上分析自己的序列。随着酵母基因组序列、鼠基因组序列和人类基因组序列的完成,会产生诸如模式识别和神经网络等先进的计算方法,并应用于新的中,并对生物医学研究的深入发展发挥巨大的作用。