Quel langage informatique pour travailler avec des données biologiques ?

En cours de BioInformatique, nous avons découvert BioPython. Ce framework a-t-il des équivalents ? D'autres langages ont-ils leur Bio* ?

Mes recherches sur Bio* (BioPython, BioJava, BioPascal, etc.) dans différents langages parmi les plus populaires m'ont montré que chaque langage a sa version de Bio*. Mais sont-ils autant utilisés ? Pour comparer la popularité de ces frameworks, j'ai choisi de comparer le nombre de résultats retournés par les principaux moteurs de recherches (Google, Yahoo! et Bing) lors d'une recherche sur leur nom. Cette méthode est très discutable mais elle a le mérite d'estimer l'utilisation de ces logiciels.

Nombre de résultats par moteur de recherche
Mot recherché Google Yahoo! Bing Moyenne
BioC# (BioCsharp) 671 51 21 743
BioC++ 227 173 (BioCpp) 102 (BioCpp) 502
BioJava 96 900 280 000 78 300 000 376 900
BioPerl 281 000 612 000 184 000 1 077 000
BioPHP 89 100 84 100 81 900 000 173 200
BioPython 95 500 156 000 113 000 364 500
BioRuby 34 300 89 700 19 500 143 500

Bing renvoie des nombres aberrants pour BioJava et BioPHP, pour ce dernier Bing mélange les vrais résultats de BioPHP avec les pages dont le nom contient bio.php mais pour BioJava je n'ai aucune explication.

D'après ces résultats, nous pouvons établir ce classement :

  1. BioPerl (1 077 000)
  2. BioJava (376 900)
  3. BioPython (364 500)

Alors, faut-il abandonner Python et passer à Perl ou Java ? Certainement pas. Néanmoins il faudra garder à l'esprit que BioPython n'est qu'un environnement de travail parmi d'autres.