Enseigner les Sciences de la nature

logo ensl   Logo du ministère de l'éducation
logo CIRI logo Immuniser Lyon
logo LBMC logo Musée Mérieux
Logo Inserm igfl igfl logo CREATIS
Logo du Museum national des histoires naturelles
Logo du musée de Confluences
logo geo 3d
Logo de Lyon 1 logo lgltpe 
Logo du Museum national des histoires naturelles
Logo du musée de Confluences
logo LBMC
logo LBMC
logos composé logo COP In My City logo Investissement d'avenirLogo du musée de Confluences
logo Météo France Logo du musée de Confluences
logo EVSlogo Grand Lyon

Partie 1 : Un peu de statistiques

 

1. Loi de STUDENT :

 

a. Une loi de Student est définie par son degré de liberté (ddl). Elle est caractérisée par une fonction appelée « densité de probabilité » : d , dont la représentation graphique a la forme d’un chapeau style bicorne, symétrique par rapport à l’axe des ordonnées.

Courbe 01

b. On dit qu’une variable aléatoire X suit la loi de Student à n degrés de liberté lorsque pour tout nombre x :

P(X≤x) = A(x) où A(x) est l’aire de la partie du plan grisée sur le graphique ci-dessus.


( pour les matheux : Formule01 )

 

2. Résultat important

 

P1 et P2 étant deux populations sur lesquelles on mesure le même caractère quantitatif, lorsque les conditions suivantes sont réunies :

  • Les populations P1 et P2 sont gaussiennes pour ce caractère (c’est-à-dire que les valeurs prises par x se répartissent en suivant une loi normale).
  • La moyenne µ du caractère x est la même pour les populations P1et P2 (µ1 = µ2)
  • L’écart-type σ du caractère x est le même pour les populations P1 et P2 (σ1 = σ2)

 

Alors la variable aléatoire T qui, à tout échantillon aléatoire E1 de taille n1 de la population P1 et à tout échantillon aléatoire E2 de taille n2 de la population P2, associe  Formule02, où  moy01 et moy02 sont les moyennes du caractère x pour E1 et E2 , suit la loi de Student à (n1 + n2 - 2) degrés de liberté.


QU’EST-CE QUE CA SIGNIFIE ?
En prenant différents échantillons E1 et E2, ce nombre : t , va varier du SEUL FAIT DU HASARD et il ne va pas varier n’importe comment !
Les valeurs prises par T vont se répartir en suivant cette loi de Student.

 

3. La position du chercheur utilisant L’IRMf :


Question : Quels sont les voxels activés en présence du stimulus ?


Imaginons que l’étude IRMf débouche pour chaque voxel sur :

  • Une série de mesures xoff (correspondant à la condition OFF)
  • Une série de mesures xon (correspondant à la condition ON)

Le même traitement est effectué pour tous les voxels, concentrons-nous maintenant sur l’un d’eux.
 

POUR UN VOXEL, nous avons 2 séries de mesures :


xoff1 ; xoff2 ;……… ; xoff,n off et xon1 ; xon2 ;……… ; xon,n on

 

Exemple numérique :
 

xoff 4,3 3,4 5,2 5,2 4 4,2 5 4,8 5,4 4,9
xon 5,8 5,2 5,3 4,8 5,4   5,3 5,5 4,7    

 

Nous avons ci-dessus noff=10 mesures en condition OFF et non=8 mesures en condition ON.
 

Ce sont les valeurs prises par x pour des échantillons Eoff et Eon des populations Poff et Pon de toutes les mesures qu’on aurait pu faire dans les conditions OFF et ON.
Nous pouvons facilement calculer les moyennes : moy03 et  moy04 ainsi que les écarts-type soff et son pour ces deux échantillons.

 

Exemple numérique :

ex_num01

 

Par contre, nous ne connaissons pas les moyennes μoff et μon des mesures x pour les populations Poff et Pon !
Et pourtant, c’est bien la comparaison entre μoff et μon (sur les populations globales) qui permettrait de répondre à la question : le voxel est-il activé en présence du stimulus ?


QUE FAIRE ? UN TEST DE VALIDITE D’HYPOTHESE UNILATERAL: DANS NOTRE CAS, CE SERA UN TEST DE STUDENT.

Comment ça marche ?


1ère étape :

Il y a d’abord 2 présupposés :
Les populations Poff et Pon sont gaussiennes pour les mesures x.
Les écarts-types Formule03et Formule04des populations Poff et Pon sont égaux (ce point peut être testé au préalable).

On estime alors cet écart-type commun par :

Formule05


Exemple numérique :

Formule06


2ème étape : formulation des hypothèses

  • Hypothèse nulle : µon = µoff , soit µon - µoff = 0 (le voxel n’est pas activé)
  • Hypothèse alternative : µon > µoff , µon - µoff  > 0 (le voxel est activé)

(Dans SPM, en écrivant Formule07, l’hypothèse nulle est : Bon = Boff et l’hypothèse alternative est : Bon > Boff )

 

3ème étape : règle de décision et décision


Sous l’hypothèse nulle (µon = µoff, pas d’activation) , la variable aléatoire qui , à tout échantillon de noff mesures xoff et à tout échantillon de non mesures xon , associeFormule08, suit la loi de Student à (noff + non - 2) degrés de liberté (nous l’avons affirmé au 1.2).
(Formule09 correspond dans SPM à βon – βoff ; à la différence notable que les β représentent la contribution des différentes conditions expérimentales aux variations du signal )


Exemple numérique :


Sous l’hypothèse nulle (µon = µoff, pas d’activation) , la variable aléatoire qui , à tout échantillon de 10 mesures xoff et à tout échantillon de 8 mesures xon, associe Formule10 ,suit la loi de Student à (10+8 -2) = 16 degrés de liberté.

Courbe02

DéterminonsFormule11 avec nos mesures.
Exemple numérique :

Formule12


Il est très improbable de trouver exactement 0 même si le voxel n’est pas activé.

Toute la difficulté est la suivante : l’écart entre tcalc et 0, vais-je décider de l’attribuer au seul hasard ou pas ? En d’autres termes, vais-je décider de déclarer le voxel activé ou pas ?

ICI EST LE POINT CRUCIAL POUR COMPRENDRE N’IMPORTE QUEL TRAVAIL D’INFERENCE STATISTIQUE.
Sous l’hypothèse nulle, la loi de Student à (noff + non - 2) degrés de liberté nous permet de calculer, A PRIORI, la probabilité que T prenne une valeur dans n’importe quel intervalle de notre choix, elle nous permet en particulier de déterminer la valeur t telle que P(T ≥ t) soit égal à une valeur α donnée (avec 0 < α < 1).


Par exemple :
Pour α = 0.05


Courbe03

Pour α = 0.01

Courbe04

 

QU’EST CE QUE CA SIGNIFIE ?


Avant mon expérimentation , en admettant que le voxel n’est pas activé , je peux affirmer que j’ai 5 chances sur 100 pour que la valeur de tcalc soit supérieure à t0.05 ; je peux affirmer que j’ai 1 chance sur 100 pour que la valeur de tcalc soit supérieure à t0.01.

De façon générale, nous pouvons, sous l’hypothèse nulle, calculer tα tel que P(T ≥  tα) = α ; α est appelé : seuil de risque.


ET MAINTENANT IL S’AGIT DE DECIDER !


Revenons au tcalc que nous avons déterminé. Quel est le raisonnement ?

  • Au seuil 0.05 , je n’avais sous l’hypothèse nulle que 5 chances sur 100 pour que la valeur de tcalc soit supérieure à t0.05. Or elle l’est. Je refuse donc l’hypothèse nulle et j’affirme, au seuil 0.05 , que le voxel est significativement activé .

Courbe05

  • Au seuil 0.01 , j’avais  sous l’hypothèse nulle 1 chance sur 100 pour que la valeur de tcalc soit supérieure à t0.01 et elle ne l’est pas. J’accepte donc l’hypothèse nulle et j’affirme, au seuil 0.01 , que le voxel  n’est pas significativement activé .

 Courbe06

 Pour être certain d’avoir bien compris la démarche, faisons des choix extrêmes :

  • Seuil de risque : 0

 Courbe07

 On a t0= +∞
L’hypothèse nulle est systématiquement validée !

Je peux affirmer, au seuil de risque 0 , qu’aucun voxel n’est activé ! Il n’est pas utile de faire une expérimentation.

AUCUN INTERET !

  • Seuil de risque : 1

Courbe08

On a t1 = - ∞
L’hypothèse nulle est systématiquement rejetée !
Je peux affirmer, au seuil de risque 1 que tous les voxels sont activés !

AUCUN INTERET NON PLUS !
 

ATTENTION :
Le sens commun voudrait que plus un seuil de risque est choisi proche de 0 , plus les conclusions d’une étude soient fiables . Ce n’est malheureusement pas si simple !
Dans ce qui suit nous éviterons l’expression « seuil de risque », qui peut induire des idées fausses. Nous utiliserons à sa place le mot « seuil ».
 

RESUME :


Nous choisissons un seuil α.
Nous déterminons tα tel que P(T ≥ tα ) = α


Courbe09.PNG

 

  • Si tcalc ≤ tα nous acceptons H0 et affirmons au seuil α que le voxel n’est pas significativement activé.
  • Si  tcalc > tα nous rejetons H0 et affirmons au seuil α que le voxel est significativement activé.


Exemple numérique :
tcalc ≈ 2.542 à 10-3 près.
Pour le degré de liberté : 16
t0.05 ≈ 1.746 à 10-3 près donc tcalc > t0.05
nous rejetons H0 et affirmons au seuil 0.05 que le voxel est significativement activé.
t0.01 ≈ 2.583 à 10-3 près donc tcalc  ≤ t0.01
nous acceptons H0 et affirmons au seuil 0.01 que le voxel n’est pas significativement activé.

REMARQUE :
Il s’agit bien d’une décision ; la réalité ne peut pas être connue en toute certitude, à partir d’inférences statistiques.
Le choix du seuil est capital dans le processus de décision et il n’est pas imposé d’un strict point de vue mathématique.
 

Accéder à la partie 2

Retourner à l'accueil