TEMA 5 – PROGRAMACIÓN CON PERL (I) (2015)

Apunte Español
Universidad Universidad Autónoma de Barcelona (UAB)
Grado Genética - 2º curso
Asignatura Técnicas instrumentales
Año del apunte 2015
Páginas 2
Fecha de subida 14/03/2015 (Actualizado: 21/03/2015)
Descargas 12

Vista previa del texto

TEMA 5 – PROGRAMACIÓN CON PERL (I) ¿Por qué Perl? PERL  Practical Extraction and Report Language. Es un lenguaje interpretado orientado a la búsqueda, extracción y formateado de ficheros de tipo texto.
¿Por qué se creó Perl? - En el momento en que se creó había una variedad de lenguajes reducida.
Se necesitaba un lenguaje rápido de programar.
Se necesitaba un lenguaje con funciones avanzadas.
Por tanto, se creó un lenguaje de nivel intermedio.
Características de Perl - - Curva de aprendizaje baja y larga: en poco tiempo se puede aprender a programar con Perl.
Trata la información de archivos de texto.
Manipula y procesa secuencias largas fácilmente.
Óptimo para escribir programas que controlan otros programas.
Muy utilizado en laboratorios de biología molecular para la creación de sitios Web dinámicos. Estas webs se crean en el momento en el que estamos navegando: cómo una búsqueda en Google.
En cambio, los sitios Web estáticos son aquellos que están escritos tal cual se muestran: html, php… Un programa puede hacerse rápidamente.
Portable. Se puede pasar de un sistema operativo a otro.
Velocidad: bueno pero no óptimo.
Fácil mantenimiento.
Herramientas para programar con Perl - Intérprete de Perl instalado.
Editor de texto, como el Bloc de notas, Notepad++ o Sublime.
Directorio de trabajo en el disco para poder guardar el programa, ya que después de crearlo, lo ejecutaremos con el intérprete paraprobarlo.
Estrategias de programación Por ejemplo, queremos buscar señales de regulación en una secuencia genómica de DNA, ¿qué hacemos? Primero de todo miramos si podemos encontrar un programa para buscar artículos que ya existan en: - NAR Database issue (January) y Web Server issue (July) PubMed Links de páginas con recursos de bioinformática (Biocatalogue http://www.biocatalogue.org/ o http://bioinfouab.uab.cat) Buscadores generales Bio* proyectos (open bioinformatics projects): bioPerl, bioJava, bioPython… Aquí podremos hacer la búsqueda de secuencias por similitud; Búsqueda de motivos funcionales; Alineamiento múltiple de secuencias; Mapas de restricción, ensamblaje secuencia, filogenias… Por ejemplo, en bioPerl hay muchos programas subidos que han sido escritos con Perl.
Si no hay un programa disponible, escribiremos un programa propio o modificaremos un previo que ya exista si es parecido al que necesitamos. Si creamos un de nuevo deberemos crear el pseudocódigo y escribir el programa en sí.
Deberemos identificar los inputs requeridos (los datos o información que debe suministrar el usuario) - - Para crear pseudocódigo: o Efectuar un diseño general del programa, incluyendo el método o algoritmo o Decidir cómo aparecerá el output (archivo, pantalla, tabla, gráfico,…) o Refinar el modelo previo en sus detalles (no olvidar los comentarios) Escribir el programa con un lenguaje de programación, en nuestro caso con código Perl.
¿Cómo pasamos de un problema a un algoritmo? Pseudocódigo (planteamiento): - - - Deberemos tener bien claro que nos pide el programa y que input tenemos, es decir, en este caso deberemos saber cuál(es) son las señal(es) de regulación que buscamos. O por ejemplo, una secuencia de DNA en un archivo.
También deberemos saber qué output deberemos obtener y cómo lo vamos a obtener: qué señales, cuantas, cuáles y dónde, etc.
Luego haríamos el algoritmo.
Abrir el archivo que almacena el DNA.
Leer y guardar su contenido.
Si es formato FASTA, eliminamos el nombre o descripción de la secuencia, es decir, la 1ª línea.
Luego eliminamos cualquier carácter que no sea DNA (!≠A, T, C, G).
Buscar reiteradamente la señal en la secuencia. Deberemos buscar una estructura que permita de forma reiterada buscar la señal mediante un bucle. Podremos tener un contador que cada vez que la encuentre sume +1, o podemos decirle al programa que cada vez que encuentre la señal guarde la posición.
Mostrar el resultado. Por ejemplo, las posiciones o el número de veces que se encuentra.
Programar es un modo de solucionar problemas resolubles de forma iterativa y gradual.
- Generar pseudocódigo Traducir Ejecutar Revisar (errores, depuración -debugging) Guardar y Backups ¿Cómo funciona un programa o script? - - - Intérprete y programa (script). Escribimos en el editor y lo guardamos con el nombre primer.pl o #  sirve para hacer comentarios. Las líneas que empiezan con este símbolo no son interpretadas o \n  salto de línea.
o ;  cada orden debe acabar en punto y coma.
o .pl  extensión de Perl Ejecutar programas: vamos a DOS (línea de comandos) y escribimos: o cd: change directory o Para cambiar el directorio también lo podemos hacer arrastrando la carpeta a la línea de comandos.
o DIR: nos muestra lo que hay en X carpeta.
Las instrucciones se ejecutan una tras otra, desde el principio.
...