Option Bioinformatique #4
Par Alexis Lefebvre le vendredi 22 mai 2009, 19:23 - Lien permanent
Cette semaine nous avons continué les exercices avec Python.
Le but du premier exercice était de transformer une séquence d'ADN en une suite d'acides aminés pour avoir la séquence de la protéine correspondante. Le code génétique en Python nous étant transmis, nous devions analyser la séquence en codons, de 3 caractères en 3 caractères puis de déterminer si le codon était un codon start, un codon stop, un codon transcrit ou un codon inconnu. Avec Python ce test est très simple à coder :
if [chaîne] in [liste ou dictionnaire] : bloc de code
Un exemple :
if 'A' in ['A','B'] : print True else : print False
L'exercice suivant consistait à lire un fichier exemple au format FASTA pour créer un dictionnaire dont les clés sont les identifiants (par exemple 2765658
) et dont les valeurs sont les séquences. Ces séquences sont sur plusieurs lignes, elles sont précédées d'une ligne d'entête et elles sont séparées par une ligne vide. Il a donc fallu lire le fichier en déterminant si chaque ligne était :
- une ligne d'entête commençant par >
- une igne vide
- une ligne de séquence
Cette semaine, nous avons aussi appris à travailler avec IDLE à la place de PythonWin. IDLE apporte quelques avantages :
- une coloration syntaxique
- une aide contextuelle, qui affiche par exemple les arguments d'une fonction pendant qu'on la tape ou la liste des méthodes disponibles dans un module Python
- les messages d'erreurs sont plus explicites
Logiciels utilisés :