Stage : résumé de la semaine #3

Pendant cette troisième semaine, j'ai passé presque tout mon temps dans le laboratoire. Je crois avoir appris et compris les techniques que je devrais répéter sur les différents échantillons sur lesquels on travaille.

J'ai pu me documenter sur le langage informatique R. J'ai découvert ses fonctions dédiées au calcul de distance et à la réalisation de dendrogrammes qui devraient répondre à notre besoin de présenter la diversité du lin de manière graphique.

J'ai pu faire quelques tests rapides avec R, voici un exemple de création d'un dendrogramme :

hc = hclust(eurodist,'average')

dend1 = as.dendrogram(hc) 

# sauvegarder l'image
png("eurodist.png")

plot(dend1,ylab="distance en kilomètres")

# sauvegarder l'image
dev.off()

eurodist est une matrice comportant les distances en kilomètres entre des villes européennes, elle est intégrée à R, c'est très pratique pour apprendre quand on a aucune donnée sur laquelle travailler. Je me demande si d'autres langages incluent des valeurs d'exemples.

Interprétées par R, ces lignes de code produisent l'image suivante :

eurodist.png

J'ai été surpris d'avoir un résultat en si peu de lignes. R semble être la solution pour traiter les données qu'on va obtenir.

Le bas de l'image est tronqué, je n'ai pas encore découvert comment ajouter de l'espace sous le dendrogramme.

Logiciels utilisés :

  • R, un langage informatique dédié aux statistiques