La phylogénie moléculaire est la discipline visant à reconstruire l'histoire des gènes et des espèces par l'analyse comparative de séquences d'ADN ou de protéines. L'approche statistique en phylogénie moléculaire, impliquant la modélisation de l'évolution des séquences par des processus stochastiques, a connu un succès croissant au cours des 10-20 dernières années, et est maintenant largement reconnue comme la plus appropriée. Le présent projet vise au développement de méthodes statistiques d'analyse phylogénétique utilisant des modèles complexes, et réalistes, de l'évolution des séquences. L'objectif méthodologique est double
Parmi les hypothèses sous-jacentes aux modèles Markoviens classiques en phylogénie, nous souhaitons relâcher celles d'indépendance des sites, de constance des vitesses et des processus d'évolution entre sites, et au cours du temps. L'approche Bayésienne, et l'intégration numérique par Chaînes de Markov Monte-Carlo, permettent potentiellement l'implémentation de tels modèles complexes. Les méthodes développées seront appliquées aux bases de données de la phylogénomique, pour traiter des questions liées aux phylogénies anciennes (origine de la thermophilie, rôle des transferts latéraux) et à la caractérisation des processus de l'adaptation moléculaire (changements site-spécifique de vitesse d'évolution, coévolution entre sites).
Les questions que nous souhaitons aborder au cours de ce projet sont résumées par les sujets de recherche des étudiants impliqués: