Cómo convertir la secuencia a Fasta

Uno de los objetivos comunes en la investigación médica consiste en la identificación de los errores , o mutaciones , en la secuencia de ADN que podrían causar enfermedad relacionada genética. La tecnología y la informática han avanzado la investigación genética a un nivel en el que miles de datos de la secuencia se pueden analizar de forma simultánea. Una estipulación del nuevo software es la conversión previa de datos de secuencias en formato FASTA. FASTA es similar al formato de texto simple . Permite múltiples piezas de datos que se compilan en un único archivo y se acelera el análisis. Sin embargo , la mayoría de los instrumentos generan archivos de secuencias en formato de texto . La conversión de texto a formato FASTA es un proceso simple utilizando el software editor de texto. Cosas que necesitará de computadora
programa de edición de texto de
Muestre Más instrucciones Matemáticas 1

Abra el archivo de texto de secuencia de ADN denominada usando el programa de edición de texto . Esto sería Editor de texto para Macintosh y Notas para sistemas compatibles con Windows . Archivos de texto de secuencia original podría tener una extensión alternativa como ss para los datos generados en un analizador genético automatizado Applied Biosystems.
2

Comienza la primera línea , escriba> seguido de un identificador de secuencia . El símbolo mayor que designa formato FASTA para los programas que analizan los datos FASTA . No existen normas específicas relativas a la identificación , siempre y cuando no haya espacios . Un ejemplo de una entrada aceptable para la primera línea es> Cat_Isomerase_Exon3 .
3

Pulse la tecla "Return" para crear un salto de línea y comenzar la segunda línea.

4

Comienza la secuencia de datos en la línea dos . Directrices de formato FASTA requieren datos de texto de ADN siguientes Unión Internacional de Química Pura y Aplicada, IUPAC , códigos . Cada línea está limitada a 80 caracteres que representan 80 bases de ADN y puede estar en mayúsculas o minúsculas. Una entrada aceptable incluyendo bases mixtas es AGCTTCGTGG ... CVTGCGTTGT .
5

Pulse la tecla "Intro " para empezar la siguiente línea de datos de la secuencia . Cada línea debe constar de 80 bases representadas por el código de la IUPAC .
6

Guarde el archivo con la extensión de archivo txt o extensión de archivo FASTA apropiado. Los programas que procesan datos FASTA formato a menudo requieren una extensión específica FASTA como fsa , fna , ffn o frn .