Oscar Oscar Camillo Ortiz


Analyse par grappe de mesures de cytométrier pa flux à des fins de caractérisation de patients cancéreux.



En collaboration avec Celia Greenwood, de l'institut de recherches médicales Lady Davis et du département de Biostatistiques de l'université McGill.

Résumé La Cytométrie par Flux (CF) est un outil très important pour identifier des composants de cellules. Cette analyse est effectuée par l'utilisation des fluorescents (variables). Cependant, l'analyse CF nous permet d'analyser, au maximum, la distribution des cellules uniquement par paires de variables en utilisant des graphiques de dispersion (scatter plots). Compte tenu de cette limite, il est difficile de tenir compte de la corrélation entre toutes les variables. Cette difficulté peut être surmontée à travers l'analyse par grappes qui tient compte des relations ( corrélations entre les variables). Dans ce rapport nous avons utilisé la méthodogie de l'analyse par grappes pour arriver à des conclusions concernant les cellules, en tenant compte de toutes les variables en même temps. Après avoir identifié les groupes de cellules, nous allons nous baser sur ces groupes de cellules pour identifier les groupes de patients qui ont des caractéristiques similaires. Cette méthodologie peut donc s'avérer utile pour aider à identifier plus facilement les patients qui ont des caractéristiques similaires, en tenant compte de l'ensemble des cellules en même temps.



.

Introduction

La cytométrie par flux (CF) « Flow Cytometry» en anglais, est une analyse qui nous permet d’obtenir la description de plusieurs caractéristiques (propriétés ou composantes) d’un échantillon de cellules ; dans notre cas il s’agit de cellules atteintes d’une sorte de lymphome. À partir de ces caractéristiques, nous proposons d’analyser les données de la CF en utilisant l’analyse par grappes. Ceci nous procurera des informations descriptives sur les caractéristiques des cellules analysées, et nous permettra aussi de créer des groupes de cellules ayant des similitudes entre elles par rapport aux mesures des différentes variables. En utilisant la CF nous pouvons déterminer dès le début le type de cancer dont un patient en particulier est atteint. Malheureusement, cette méthodologie présente des inconvénients tels que le malaise que le patient est obligé d’endurer, ainsi que la difficulté à interpréter les analyses effectuées, dû à la grande quantité d’information fournie par la CF. Ainsi, lorsque nous utilisons uniquement l’analyse CF pour trouver des similitudes entre les patients, cette méthodologie s’avère surtout intuitive, et des fois même impraticable. Par contre, l’analyse par grappe est une méthodologie qu’on devrait utiliser lorsqu’on dispose d’une grande quantité d’information car elle nous permet de regrouper les cellules individuelles selon leurs similitudes, tout en tenant compte des différentes variables. Ainsi, à travers cette méthodologie, on peut trouver différentes sous-populations qui demeurent mélangées et difficiles à identifier dans l’ensemble des données originales. Donc, à partir des résultats obtenus par l’analyse CF, nous pouvons caractériser les patients selon les différents types de cancer dont ils sont atteints. L’analyse (CF) a été développée dans les années 30, lorsque M. Andrew Moldavan a conçu un appareil capable de compter le nombre de cellules par un tube capillaire et un microscope. Ensuite, dans les années 50, Taylor et Crosland ont implémenté la base de la cytrométrie par flux, en rajoutant le flux dans lequel les cellules passent, de sorte à ce que les cellules se trouvent exactement au centre du flux (et non pas aux côtés de celui-ci). Cette propriété existe toujours aujourd’hui. Aussi, dans les années 50, Coulter a fait une contribution très importante pour la CF, en mesurant le volume des cellules par un moyen électronique. Au fil du temps, et jusqu’à aujourd’hui, plusieurs chercheurs ont fait des améliorations à la cytrometrie par flux, de sorte à ce que le cytomètre peut mesurer des reflets de diffusion vers l’avant (forward scatter), et des reflets de diffusion latérale (side scatter) – FS et SS sont les abréviations en anglais. Le cytomètre peut aussi mesurer jusqu’à 11 couleurs d’immunofluorescence qui aident identifier les différentes protéines présentes dans chacune des cellules. On peut donc dire que la CF est l’une des plus importantes inventions utilisée dans l’identification des sous-populations, en tenant compte de multiples paramètres (variables ou caractéristiques). Cette analyse s’avère très utile dans la recherche biologique et clinique, entre autres. Un défi qu’il faut relever pour bien profiter de l’analyse CF est de pouvoir analyser de façon simple et rapide l’énorme quantité d’information obtenue par cette méthodologie. En effet, actuellement, l’analyse CF nous fournit jusqu’à 12 couleurs de fluorescence qui mesurent les différentes caractéristiques de la cellule ainsi que les variables FS et SS reliés à la taille de la cellule. Ainsi, pour chaque cellule, on peut mesurer jusqu’à 14 variables ou caractéristiques. Pour réussir à analyser cette grande quantité d’information fournie par la CF, en tenant compte de l’ensemble des variables à la fois, le défi sera de pouvoir caractériser les cellules semblables par rapport à un type particulier de lymphome. Comme nous venons de le mentionner, la cytométrie par flux peut généralement nous fournir une très grande quantité d’informations, ce qui peut s’avérer laborieux à analyser ou à traiter. D’ailleurs il n’est pas facile de lire le format obtenu par le cytomètre en utilisant le logiciel R dont nous nous sommes servis pour traiter et analyser ces données. Le défi qu’il faudra relever lors de l’analyse de l’information fournie par la CF sera de comprendre les données qu’on reçoit du cytomètre, ainsi que de trouver une façon de lire ces données par le logiciel R. Ensuite, il faudra étudier le type d’analyse par grappe (cluster) le plus approprié pour traiter l’information et distinguer ainsi les similitudes entre les cellules, ce qui, à son tour, nous permettra de trouver les similitudes entre les patients. En utilisant l’analyse par grappes, nous allons former des groupes de cellules, où celles qui ont des caractéristiques similaires seront regroupées dans une même grappe ou groupe. À partir de cela nous pourrions déduire que les cellules qui présentent le même type de cancer ou lymphome seront concentrées dans la même grappe ou groupe. Par conséquent, en utilisant à nouveau l’analyse par grappe à partir des groupes déjà formés par les cellules, nous pourrons ensuite regrouper les patients. Pour atteindre cet objectif, nous avons essayé plusieurs méthodes pour mesurer la distance entre les cellules, ainsi que différentes méthodes de regroupement. Nous avons recouru à la méthodologie décrite dans les articles « Detection and Monitoring of Normal and Leukemic Cell Populations with Hierarchical Clustering of Flow Cytometry Data » (Karel Fiser, 2011) et «Resolving and classifying haematopoietic bone-marrow cell data» (Eli Zamir et Katz, 2005) où les auteurs utilisent la distance de Mahalanobis qui tient compte de la distribution allongée que présentent les cellules dans le cas de la cytometrie par flux.