Sélection Fstats : Weir & Cockerham

Procédure qui permet de calculer les indices de fixation F de Wright (1969) ,d après les formules de Weir & Cockerham (1984).

La procédure Fstats fournit l'estimation du Fis moyen sur l'ensemble des populations, du Fst et du Fit tels qu'ils sont calculés dans le cadre d'un modèle en île où toutes les populations sont équivalentes et représentent une réalisation particulière de l'équilibre migration/dérive.

Correspondance entre les paramètres de Wright et leurs estimateurs selon Weir & Cockerham :
Wright
Weir & Cockerham
Fit F = 1- C/(A+B+C) estime la corrélation des gènes chez les individus
Fis f = 1- C/(B+C) estime la corrélation des gènes chez les individus dans une population
Fst Théta = A/(A+B+C) estime la corrélation des gènes entre individus dans une population par rapport à l'ensemble des populations

La relation entre ces trois paramètres est f = (F-Théta )/(1-Théta)

Les valeurs de Fis pour chaque population sont calculées dans la sélection VariabilitéVariab. La procédure FSTAT fournit quant à elle la seule moyenne de Fis sur l'ensemble des populations.

La signification des paramètres pour un allèle i est la suivante :
Ai composante inter-population de la variance des fréquences alléliques
Bi composante, entre individus à l'intérieur de chaque population, de la variance des fréquences alléliques
Ci composante,entre gamètes à l'intérieur de chaque individus, de la variance des fréquences alléliques

Les calculs de A, B et C sont détaillés dans Weir & Cockerham (1984) et Weir (1990).

L'estimation de pour un locus tous allèles i confondus est donnée selon Weir & Cockerham :

et selon Robertson & Hill (1984) (voir Weir & Cockerham, 1984, p. 1363) :

où Pi = fréquence de i et n = nombre d'allèles au locus.

De même, pour les estimations multilocus (Weir & Cockerham, 1984, p. 1364).

On notera que l'estimateur pondéré selon Robertson & Hill donne plus de poids aux allèles rares que celui pondéré selon Weir & Cockerham. La pondération de Robertson & Hill est justifiée par le fait que la variance de leur estimateur est moins grande pour de faibles valeurs de Fst. Toutefois, l’estimateur RH sous-estime légèrement Fst comme l’ont montré Raufaste & Bonhomme (00) qui proposent une correction à ce biais quand le nombre d’allèles est supérieur à 2 (estimateur RH’). Ce nouvel estimateur est donc non biaisé et possède une variance minimale lorsque le Fst est inférieur à 0,05 environ, ce qui correspond à un domaine de validité applicable aux niveaux de variabilité fréquemment observés avec des marqueurs multialléliques du type microsatellites.

RH corrigé Raufaste & Bonhomme (00):
          Fst(RH')  = RH = WC lorsque nb. allèles = 2 ou Fst > 0.2,
          Fst(RH')  = RH + (RH²/ (nb pop * (nb allèles-1)) ) * (somme[1/Pi]/(3*nb allèles)) qd nb. allèles > 2 et Fst <= 0.2
 

 L’estimateur WC de Weir & Cockerham est quant à lui non biaisé, mais sa variance n’est minimale que lorsque le Fst est supérieur à 0,10.
 
 
0,00 < Fst < 0,05 0,05 < Fst < 0,10 Fst > 0,10
WC non biaisé, forte variance non biaisé, variance moyenne non biaisé, variance faible
RH biaisé, faible variance biaisé, variance moyenne biaisé, variance forte
RH' non biaisé, faible variance non biaisé, variance moyenne non biaisé, variance forte

 
 

Les variances sur Fit, Fis et Fst sont estimées par rééchantillonnage selon la méthode dite du Jackknife (Weir, 1990) sur les locus et sur les populations. Ceci permet d'obtenir un intervalle de confiance autour des estimées de chaque paramètre. Néanmoins cet intervalle est peu précis s'il y a peu de populations (ou peu de locus) et ne doit pas servir à tester l'hypothèse nulle, mais plutôt à voir l'influence du choix du plan d'échantillonnage (en terme de locus et/ou populations) sur les valeurs des paramètres. On remarquera que si la variance sur les locus est importante, le calcul d'un F multilocus n'a pas beaucoup de sens et qu'il vaut mieux reconsidérer les résultats par groupes de locus en fonction de leur contribution au F global. Pour tester la significativité des valeurs des paramètres par rapport à l'hypothèse nulle de panmixie, se reporter à la section Fstats : test sur permutons, où l'on teste la significativité de Fis, Fst et Fit à plan d'échantillonnage fixé en ne considérant que l'erreur d'échantillonnage faite sur les individus.

Le Jackknife n'est exécuté que si votre fichier contient plus de 2 populations ou locus.

Fichier de données : voir construction de Fichiers.