Oscar Camillo Ortiz

Analyse par grappe de mesures de cytométrier pa flux à des fins de caractérisation de patients cancéreux.

En collaboration avec Celia Greenwood, de l'institut de recherches médicales Lady Davis et du département de Biostatistiques de l'université McGill.

Résumé La Cytométrie par Flux (CF) est un outil très important pour identifier des composants de cellules. Cette analyse est effectuée par l'utilisation des fluorescents (variables). Cependant, l'analyse CF nous permet d'analyser, au maximum, la distribution des cellules uniquement par paires de variables en utilisant des graphiques de dispersion (scatter plots). Compte tenu de cette limite, il est difficile de tenir compte de la corrélation entre toutes les variables. Cette difficulté peut être surmontée à travers l'analyse par grappes qui tient compte des relations ( corrélations entre les variables). Dans ce rapport nous avons utilisé la méthodogie de l'analyse par grappes pour arriver à des conclusions concernant les cellules, en tenant compte de toutes les variables en même temps. Après avoir identifié les groupes de cellules, nous allons nous baser sur ces groupes de cellules pour identifier les groupes de patients qui ont des caractéristiques similaires. Cette méthodologie peut donc s'avérer utile pour aider à identifier plus facilement les patients qui ont des caractéristiques similaires, en tenant compte de l'ensemble des cellules en même temps.

Introduction

La cytométrie par flux (CF) « Flow Cytometry» en anglais, est une analyse qui nous permet d’obtenir la description de plusieurs caractéristiques (propriétés ou composantes) d’un échantillon de cellules ; dans notre cas il s’agit de cellules atteintes d’une sorte de lymphome. À partir de ces caractéristiques, nous proposons d’analyser les données de la CF en utilisant l’analyse par grappes. Ceci nous procurera des informations descriptives sur les caractéristiques des cellules analysées, et nous permettra aussi de créer des groupes de cellules ayant des similitudes entre elles par rapport aux mesures des différentes variables. En utilisant la CF nous pouvons déterminer dès le début le type de cancer dont un patient en particulier est atteint. Malheureusement, cette méthodologie présente des inconvénients tels que le malaise que le patient est obligé d’endurer, ainsi que la difficulté à interpréter les analyses effectuées, dû à la grande quantité d’information fournie par la CF. Ainsi, lorsque nous utilisons uniquement l’analyse CF pour trouver des similitudes entre les patients, cette méthodologie s’avère surtout intuitive, et des fois même impraticable. Par contre, l’analyse par grappe est une méthodologie qu’on devrait utiliser lorsqu’on dispose d’une grande quantité d’information car elle nous permet de regrouper les cellules individuelles selon leurs similitudes, tout en tenant compte des différentes variables. Ainsi, à travers cette méthodologie, on peut trouver différentes sous-populations qui demeurent mélangées et difficiles à identifier dans l’ensemble des données originales. Donc, à partir des résultats obtenus par l’analyse CF, nous pouvons caractériser les patients selon les différents types de cancer dont ils sont atteints. L’analyse (CF) a été développée dans les années 30, lorsque M. Andrew Moldavan a conçu un appareil capable de compter le nombre de cellules par un tube capillaire et un microscope. Ensuite, dans les années 50, Taylor et Crosland ont implémenté la base de la cytrométrie par flux, en rajoutant le flux dans lequel les cellules passent, de sorte à ce que les cellules se trouvent exactement au centre du flux (et non pas aux côtés de celui-ci). Cette propriété existe toujours aujourd’hui. Aussi, dans les années 50, Coulter a fait une contribution très importante pour la CF, en mesurant le volume des cellules par un moyen électronique. Au fil du temps, et jusqu’à aujourd’hui, plusieurs chercheurs ont fait des améliorations à la cytrometrie par flux, de sorte à ce que le cytomètre peut mesurer des reflets de diffusion vers l’avant (forward scatter), et des reflets de diffusion latérale (side scatter) – FS et SS sont les abréviations en anglais. Le cytomètre peut aussi mesurer jusqu’à 11 couleurs d’immunofluorescence qui aident identifier les différentes protéines présentes dans chacune des cellules. On peut donc dire que la CF est l’une des plus importantes inventions utilisée dans l’identification des sous-populations, en tenant compte de multiples paramètres (variables ou caractéristiques). Cette analyse s’avère très utile dans la recherche biologique et clinique, entre autres. Un défi qu’il faut relever pour bien profiter de l’analyse CF est de pouvoir analyser de façon simple et rapide l’énorme quantité d’information obtenue par cette méthodologie. En effet, actuellement, l’analyse CF nous fournit jusqu’à 12 couleurs de fluorescence qui mesurent les différentes caractéristiques de la cellule ainsi que les variables FS et SS reliés à la taille de la cellule. Ainsi, pour chaque cellule, on peut mesurer jusqu’à 14 variables ou caractéristiques. Pour réussir à analyser cette grande quantité d’information fournie par la CF, en tenant compte de l’ensemble des variables à la fois, le défi sera de pouvoir caractériser les cellules semblables par rapport à un type particulier de lymphome. Comme nous venons de le mentionner, la cytométrie par flux peut généralement nous fournir une très grande quantité d’informations, ce qui peut s’avérer laborieux à analyser ou à traiter. D’ailleurs il n’est pas facile de lire le format obtenu par le cytomètre en utilisant le logiciel R dont nous nous sommes servis pour traiter et analyser ces données. Le défi qu’il faudra relever lors de l’analyse de l’information fournie par la CF sera de comprendre les données qu’on reçoit du cytomètre, ainsi que de trouver une façon de lire ces données par le logiciel R. Ensuite, il faudra étudier le type d’analyse par grappe (cluster) le plus approprié pour traiter l’information et distinguer ainsi les similitudes entre les cellules, ce qui, à son tour, nous permettra de trouver les similitudes entre les patients. En utilisant l’analyse par grappes, nous allons former des groupes de cellules, où celles qui ont des caractéristiques similaires seront regroupées dans une même grappe ou groupe. À partir de cela nous pourrions déduire que les cellules qui présentent le même type de cancer ou lymphome seront concentrées dans la même grappe ou groupe. Par conséquent, en utilisant à nouveau l’analyse par grappe à partir des groupes déjà formés par les cellules, nous pourrons ensuite regrouper les patients. Pour atteindre cet objectif, nous avons essayé plusieurs méthodes pour mesurer la distance entre les cellules, ainsi que différentes méthodes de regroupement. Nous avons recouru à la méthodologie décrite dans les articles « Detection and Monitoring of Normal and Leukemic Cell Populations with Hierarchical Clustering of Flow Cytometry Data » (Karel Fiser, 2011) et «Resolving and classifying haematopoietic bone-marrow cell data» (Eli Zamir et Katz, 2005) où les auteurs utilisent la distance de Mahalanobis qui tient compte de la distribution allongée que présentent les cellules dans le cas de la cytometrie par flux.