Sélection Fstats : Gst de Nei

Nei (1973, 1977) a proposé un analogue du Fst de Wright, appelé Gst, indice de mesure de la différenciation génétique qui s'écrit en fonction des fréquences alléliques à plusieurs locus multialléliques :

Gst = 1 - Hs/Ht,

où Hs = moyenne des hs sur l'ensemble des locus ; hs = moyenne arithmétique sur l'ensemble des sous-populations (échantillons) de la diversité génétique monolocus par sous-population,

et Ht = moyenne arithmétique des ht sur l'ensemble des locus ; ht = diversité génétique monolocus sur la population totale.

L'indice ci-dessus est fréquemment utilisé, sans correction de biais, comme estimateur de Fst. (voir p. ex. Ward et al. 1994 ; Jarne 1996). Cependant, un tel estimateur présente plusieurs biais, relatifs à l'échantillonnage d'individus, de sous-populations, voire de locus. Des corrections de biais sont proposées par Nei & Chesser (1983) et Chakraborty & Leimar (1987). Les estimateurs ainsi construits nécessitent d'avoir accès aux données génotypiques

L'estimateur non corrigé (Gst ci-dessus) reste utile à titre de comparaison avec la littérature, lorsque seules les données de fréquences alléliques sont disponibles. Voir alors Ward et al. (1994) pour une méthode d'estimation de la variance d'échantillonnage de Gst à l'aide d'un bootstrap.

Deux estimateurs sont proposés par GENETIX, Gst (estimateur non corrigé) et Gst(nc) (estimé selon Nei & Chesser 1983) ;

Gst(nc) = 1 - Hs(nc)/Ht(nc),

où Hs(nc) = N(Hs - Ho/2N) / (N-1) ; Ho = moyenne arithmétique, sur l'ensemble des sous-populations, des hétérozygoties observées ; N = moyenne harmonique des tailles des échantillons,

et Ht(nc) = Ht + (Hs(nc) - Ho/2)/Nn ; n = nombre de sous-populations (échantillons).