Problématique

La phylogénie moléculaire est la discipline visant à reconstruire l'histoire des gènes et des espèces par l'analyse comparative de séquences d'ADN ou de protéines. L'approche statistique en phylogénie moléculaire, impliquant la modélisation de l'évolution des séquences par des processus stochastiques, a connu un succès croissant au cours des 10-20 dernières années, et est maintenant largement reconnue comme la plus appropriée. Le présent projet vise au développement de méthodes statistiques d'analyse phylogénétique utilisant des modèles complexes, et réalistes, de l'évolution des séquences. L'objectif méthodologique est double

  1. diminuer, grâce à l'usage de modèles se rapprochant des processus évolutifs réels, le biais des estimateurs d'arbre phylogénétique, et donc reconstruire plus fidèlement l'histoire des gènes et des espèces - c'est notamment une nécessité pour les phylogénies très anciennes, impliquant des niveaux de divergence élevés entre séquences.
  2. modéliser explicitement les phénomènes évolutifs liés à la structure et à la fonction des molécules, tels que le niveau de contrainte fonctionnelle des différents sites (qui conditionne leur vitesse d'évolution) ou les interactions entre sites, et donc mieux comprendre la fonction des molécules grâce à la reconstruction des processus évolutifs qu'elles ont suivis.

Parmi les hypothèses sous-jacentes aux modèles Markoviens classiques en phylogénie, nous souhaitons relâcher celles d'indépendance des sites, de constance des vitesses et des processus d'évolution entre sites, et au cours du temps. L'approche Bayésienne, et l'intégration numérique par Chaînes de Markov Monte-Carlo, permettent potentiellement l'implémentation de tels modèles complexes. Les méthodes développées seront appliquées aux bases de données de la phylogénomique, pour traiter des questions liées aux phylogénies anciennes (origine de la thermophilie, rôle des transferts latéraux) et à la caractérisation des processus de l'adaptation moléculaire (changements site-spécifique de vitesse d'évolution, coévolution entre sites).

Les questions que nous souhaitons aborder au cours de ce projet sont résumées par les sujets de recherche des étudiants impliqués:

  • Modèle bayésiens hétérogènes pour la phylogénie moléculaire (S. Blanquart, LIRMM)
  • Cartographie des changements d'état et de vitesse d'évolution le long d'un arbre \x{2013} coévolution \x{2013} covarion (J. Dutheil, GPIA)
  • Transferts horizontaux et thermophilie chez les bactéries (A. Calteau, BBE)
  • Algorithme rapide de recherche de maximum de vraisemblance pour un modèle évolutif non homogène (B. Bousseau, BBE)