. Entrevues .


Les entrevues suivantes peuvent vous permettre de comprendre les sujets de recherche de l'équipe.


Ma recherche se concentre essentiellement en statistique génétique, particulièrement dans le sujet de la cartographie génétique fine.

. introduction .


Un des aspects les plus intéressants de la recherche génétique actuelle consiste à localiser les gènes impliqués dans des maladies. Ces gènes sont habituellement défectueux dû à une ou plusieurs mutations. Nous appelons une telle mutation un TIM, pour trait-influencing mutation. D'abord, un échantillon de la population sous étude est retenu; cet échantillon est constitué de séquences considérées comme des séries de marqueurs génétiques (c'est-à-dire, des variations de l'ADN à des positions données dans le génome). Pour localiser ces gènes défectueux, deux approches sont possibles: le linkage et le déséquilibre de liaison. Le linkage utilise des modèles de transmission des chromosomes dans des généalogies familiales dans le but de tester différentes hypothèses sur la position du gène. Cependant, le faible nombre de générations des généalogies familiales ne permet qu'une faible précision des estimés, à cause du petit nombre de recombinaisons présentes dans des généalogies familiales. La recombinaison est le phénomène fondamental qui nous permet de faire de la cartographie génétique: de générations en générations, c'est par le processus de recombinaison que les chromosomes se mélangent, laissant ainsi des traces nous permettant de construire des modèles de probabilité de transmission des chromosomes. Sans recombinaison, il n'y aurait pas de variation, et donc pas de cartographie (notons cependant que de nouvelles méthodes, basées sur la biologie moléculaire, se développent et elles ne sont pas basées sur ces concepts). Pour pallier au manque de résolution des études de linkage, on peut utiliser le déséquilibre de liaison (linkage disequilibrium). Celui-ci réfère à l'association non aléatoire entre des allèles à différents loci liés. Pour l'illustrer, supposons qu'une mutation se soit produite chez un ancêtre dans le passé voilà quelques dizaines de générations, et que nous échantillonnions aujourd'hui des individus atteints de la maladie causée par le TIM en question. Si l'on suppose que la maladie est rare (et simple), tous les cas vont partager non seulement le TIM en cause, mais également des segments d'ADN dans la région de la mutation. Plus la population est vieille, plus ce mélange sera grand. Évidemment, d'autres concepts, comme les mutations, entrent en cause dans la transmission du bagage génétique.

. déséquilibre de liaison .


Depuis quelques années, différents auteurs ont proposés des méthodes pour étudier le déséquilibre de liaison et faire de la cartographie fine, c'est-à-dire, chercher et identifier précisément la position du TIM à l'intérieur d'une région chromosomique, qui aura elle-même été identifiée au préalable par linkage, par exemple. Comme nous travaillons sur une population, la généalogie de la population n'est habituellement pas connue; il faut l'inférer. Ces méthodes vont donc construire des modèles décrivant la généalogie des séquences échantillonnées, puis développer des probabilités de transmission du bagage génétique sur ces généalogies en tenant compte habituellement des deux événements majeurs affectant la transmission de l'ADN: les mutations et les recombinaisons. La plupart des méthodes de cartographie fine supposent des généalogies qui décrivent de façon simpliste l'histoire des chromosomes, par des généalogies en étoile, ignorant ainsi la dépendance entre les séquences, ou mieux, par des arbres. Cependant, quand un événement de recombinaison se produit, une séquence provient de deux parents dans le passé, et l'histoire réelle de la séquence ressemble plus à un graphe qu'à un arbre. D'autre part, certaines de ces méthodes sont basées sur des combinaisons de statistiques à différents marqueurs et n'utilisent pas toute l'information disponible. Pour pallier à cette faiblesse, des méthodes multilocus utilisant la dépendance entre les marqueurs ont été développées.

. processus de coalescence .


Il existe par ailleurs un moyen simple de modéliser l'histoire des séquences: il s'agit du processus de coalescence. Avec de simples hypothèses dont beaucoup peuvent être allégées, le processus de coalescence est un processus stochastique qui nous permet de simuler un arbre qui décrit l'histoire des séquences observées en partant de l'échantillon et en remontant jusqu'à l'ancêtre commun de toutes ces séquences. Deux types d'événements sont alors considérés: des événements de coalescence, quand deux séquences trouvent un ancêtre commun, et des événements de mutation quand un marqueur d'une séquence mute vers un autre état. Le processus de coalescence est un outil utilisé pour inférer certains paramètres, comme des taux de mutation par exemple. De plus, la recombinaison peut être incorporée dans le processus de coalescence; un graphe est alors construit au lieu d'un arbre, et l'on obtient le graphe de recombinaison ancestral (ARG). Ma recherche consiste à développer une méthode de cartographie fine basée sur le graphe de recombinaison ancestral. Une équation de récurrence reliant l'état de la généalogie à une étape dans le passé vers une autre étape peut être utilisée pour faire des inférences sur la position du TIM.