Corrigé du TP6

1. Test d'homogénéité.

obs=[51 29;38 12;86 34]
somligne=sum(obs,'c');somcol=sum(obs,'r');total=sum(somligne)
[obs,somligne;somcol,total]
On obtient la matrice des effectifs observés complétés de la somme des effectifs par ligne et par colonne :
    51.     29.    80.
    38.     12.    50.
    86.     34.    120.
    175.   75.    250.

Effectifs théoriques sous l'hypothèse d'homogénéité :
theo=somligne*(somcol/total)
    56.    24.
    35.    15.
    84.    36.

Chi2 calculé à partir des effectifs observés et des effectifs théoriques
sum(((obs-theo).^2)./theo)
    2.5039683

95ème centile de la loi Chi^2_2 (le degré de liberté est (2-1)*(3-1)=2)
cdfchi("X",2,.95,.05)
    5.9914646

On test l'hypothèse H_0 : "les trois groupes sont homogènes" en comparant le Chi2 calculé au 95ème centile de la loi Chi^2_2. Si le Chi2 calculé est supérieur au Chi2 théorique, on rejette l'hypothèse H_0 avec une probabilité de rejet à tort de 5%. Avec nos calculs, on ne rejette pas l'hypothèse H_0.

Remarque : On n'a pas considéré d'hypothèse alternative à H_0 et le risque de deuxième espèce associé.


2. Un second test d'homogénéité.
obs=[280 210 110;220 90 90]
somligne=sum(obs,'c');somcol=sum(obs,'r');total=sum(somligne);
theo=somligne*(somcol/total);
sum(((obs-theo).^2)./theo)
    17.916667
Qu'on compare avec 5.99.. (comme en 1 le degré de liberté est 2).
Cette fois on est amené à rejeter l'hypothèse H_0 selon laquelle les deux groupes (traitement 1 et traitement 2) sont homogènes.


3. Un test d'indépendance.
obs=[38 82;72 108]
somligne=sum(obs,'c');somcol=sum(obs,'r');total=sum(somligne);
theo=somligne*(somcol/total);

sum(((obs-theo).^2)./theo)
    2.15311
Qu'on compare avec
cdfchi("X",1,.9,.1) (un seul degré de liberté, seuil de rejet à tord de 10%)
   2.7055435
On ne rejette pas l'hypothèse H_0.
Le 95ème centile est supérieur au 90ème centile. Si on n'a pas rejeté H_0 au seuil de 10%, on ne la rejettera pas non plus au seuil de 5%.


4. Un test d'adéquation à une loi normale.
index=[45,47,49,51,53,55,57,59]
obs=[68 103 152 206 175 156 85 55]
f=[];for i=1:7;f(i)=cdfnor("PQ",index(i),50.8,3.72);end;f(8)=1;
theo=[];theo(1)=1000*f(1);for i=2:8;theo(i)=1000*(f(i)-f(i-1));end
theo'
    59.481649    94.025882    160.73119    207.19946    201.43488    147.68483    81.651761    47.790352
sum(((obs-theo').^2)./(theo')) //attention theo est un vecteur colonne -> theo' vecteur ligne
   7.7199087
cdfchi("X",7,.95,.05) // Le degré de liberté est 7
   14.06714
La valeur du 95ème centile est supérieur à la valeur du Chi2 calculée. Au seuil de 5% on ne rejette donc pas l'hypothèse selon laquelle la distribution des poids des 1000 sachets suit la loi N(50.8 , 3.72).

Représentations en batons des effectifs observés et des effectifs théoriques :
clf();plot2d3(index,obs,rect=[44,0,60,220]);plot2d3(index+.5,theo,style=2)
xtitle("effectif obs en noir - theo en bleu")