Procédure qui permet de calculer les indices de fixation F de Wright (1969) ,d après les formules de Weir & Cockerham (1984).
La procédure Fstats fournit l'estimation du Fis moyen sur l'ensemble des populations, du Fst et du Fit tels qu'ils sont calculés dans le cadre d'un modèle en île où toutes les populations sont équivalentes et représentent une réalisation particulière de l'équilibre migration/dérive.
Correspondance entre les paramètres de Wright et leurs estimateurs selon Weir & Cockerham :
|
|
|
---|---|---|
Fit | F = 1- C/(A+B+C) | estime la corrélation des gènes chez les individus |
Fis | f = 1- C/(B+C) | estime la corrélation des gènes chez les individus dans une population |
Fst | Théta = A/(A+B+C) | estime la corrélation des gènes entre individus dans une population par rapport à l'ensemble des populations |
La relation entre ces trois paramètres est f = (F-Théta )/(1-Théta)
Les valeurs de Fis pour chaque population sont calculées dans la sélection VariabilitéVariab. La procédure FSTAT fournit quant à elle la seule moyenne de Fis sur l'ensemble des populations.
La signification des paramètres pour un allèle i est la suivante :
Ai | composante inter-population de la variance des fréquences alléliques |
Bi | composante, entre individus à l'intérieur de chaque population, de la variance des fréquences alléliques |
Ci | composante,entre gamètes à l'intérieur de chaque individus, de la variance des fréquences alléliques |
Les calculs de A, B et C sont détaillés dans Weir & Cockerham (1984) et Weir (1990).
L'estimation de pour un locus tous allèles i confondus est donnée selon Weir & Cockerham :
et selon Robertson & Hill (1984) (voir Weir & Cockerham, 1984, p. 1363) :
où Pi = fréquence de i et n = nombre d'allèles au locus.
De même, pour les estimations multilocus (Weir & Cockerham, 1984, p. 1364).
On notera que l'estimateur pondéré selon Robertson & Hill donne plus de poids aux allèles rares que celui pondéré selon Weir & Cockerham. La pondération de Robertson & Hill est justifiée par le fait que la variance de leur estimateur est moins grande pour de faibles valeurs de Fst. Toutefois, l’estimateur RH sous-estime légèrement Fst comme l’ont montré Raufaste & Bonhomme (00) qui proposent une correction à ce biais quand le nombre d’allèles est supérieur à 2 (estimateur RH’). Ce nouvel estimateur est donc non biaisé et possède une variance minimale lorsque le Fst est inférieur à 0,05 environ, ce qui correspond à un domaine de validité applicable aux niveaux de variabilité fréquemment observés avec des marqueurs multialléliques du type microsatellites.
RH corrigé Raufaste & Bonhomme (00):
Fst(RH')
= RH = WC lorsque nb. allèles = 2 ou Fst > 0.2,
Fst(RH')
= RH + (RH²/ (nb pop * (nb allèles-1)) ) * (somme[1/Pi]/(3*nb
allèles)) qd nb. allèles > 2 et Fst <= 0.2
L’estimateur WC de Weir & Cockerham est quant à lui
non biaisé, mais sa variance n’est minimale que lorsque le Fst est
supérieur à 0,10.
0,00 < Fst < 0,05 | 0,05 < Fst < 0,10 | Fst > 0,10 | |
WC | non biaisé, forte variance | non biaisé, variance moyenne | non biaisé, variance faible |
RH | biaisé, faible variance | biaisé, variance moyenne | biaisé, variance forte |
RH' | non biaisé, faible variance | non biaisé, variance moyenne | non biaisé, variance forte |
Les variances sur Fit, Fis et Fst sont estimées par rééchantillonnage selon la méthode dite du Jackknife (Weir, 1990) sur les locus et sur les populations. Ceci permet d'obtenir un intervalle de confiance autour des estimées de chaque paramètre. Néanmoins cet intervalle est peu précis s'il y a peu de populations (ou peu de locus) et ne doit pas servir à tester l'hypothèse nulle, mais plutôt à voir l'influence du choix du plan d'échantillonnage (en terme de locus et/ou populations) sur les valeurs des paramètres. On remarquera que si la variance sur les locus est importante, le calcul d'un F multilocus n'a pas beaucoup de sens et qu'il vaut mieux reconsidérer les résultats par groupes de locus en fonction de leur contribution au F global. Pour tester la significativité des valeurs des paramètres par rapport à l'hypothèse nulle de panmixie, se reporter à la section Fstats : test sur permutons, où l'on teste la significativité de Fis, Fst et Fit à plan d'échantillonnage fixé en ne considérant que l'erreur d'échantillonnage faite sur les individus.
Le Jackknife n'est exécuté que si votre fichier contient plus de 2 populations ou locus.
Fichier de données : voir construction de Fichiers.