Intervalle de confiance.

Aller en bas

Intervalle de confiance.

Message par Dlzlogic le Lun 22 Jan - 14:31

Bonjour,
Encore une question sur la signification de l'intervalle de confiance.
Ref. http://forums.futura-sciences.com/mathematiques-superieur/811919-statistique-intervalle-de-confiance.html
C'est un vieux sujet qui a déjà provoqué beaucoup d'échanges. Il a été mis en parallèle avec l'intervalle de fluctuation. Si les étudiants posent la question c'est qu'ils n'ont pas compris, et à voir les réponses de certains sachant, ceux-ci n'ont pas compris non plus.
Lorsqu'on fait une mesure ou une observation, quel que soit le contexte ou la méthode, on obtient une série de nombres et on en prend la moyenne arithmétique. Ensuite, si on est rigoureux, on calcule l'écart type, c'est à dire l'écart moyen quadratique que l'on appelle souvent sigma.
On sait que si le nombre d'observations est assez grand, la répartition des écarts à la moyenne est "normale", c'est à dire que 65% environ des écarts seront dans l'intervalle +/- 1 sigma, 95% environ des écarts seront dans l'intervalle +/- 2 signa et pratiquement 100% seront dans l'intervalle +/- 3 sigma. Ca c'est la notion élémentaire.    
La phrase "Prenons pour exemple le fait que l'age moyenne d'une certaine population est de 20 ans et notre intervalle de confiance est de 95%." ne veut pas dire grand-chose. En effet, si l'age moyen d'une population est 20 ans, ça pourrait vouloir dire que 95% des individus est dans l'intervalle [20 - 2 sigma ; 20 + 2 sigma], ce qui certainement faux, puisqu'il y a des individus bébés et des personnes âgées.
Par contre, si on dit "l'âge moyen des membres de cette salle de sport est 20 ans avec un intervalle de confiance +- 2 sigma de 95%" ce n'est pas forcément idiot, mais assez peu probable, pour la simple raison que l'age des membres d'une salle de sport n'a rien à voir avec le hasard.  
Bien sûr le demandeur a oublié de dire que l'intervalle de confiance était +/- 2 sigma par rapport à la moyenne, mais on peut penser que c'était sous-entend, étant donné le nombre de fois que l'on en parle.
Je profite de cette question pour rappeler que "l'age moyen" est une notion qui n'a pas un sens très précis, est-ce la moyenne des âges, c'est à dire la somme des âges divisée par le nombre d'individus ou l'âge de la moyenne des individus, ce qui correspondrait plutôt à la médiane. On retrouve cette même ambiguïté lorsqu'on parle du "salaire moyen". De toute façon, dans ces deux cas, la moyenne arithmétique dans un contexte probabiliste n'a pas beaucoup de sens.      

Bonne journée.

Dlzlogic

Messages : 1163
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Intervalle de confiance.

Message par Dlzlogic le Mar 23 Jan - 14:42

Bonjour,
Décidément les exercices sur l'intervalle de confiance reviennent à la mode.
réf. https://www.maths-forum.com/lycee/test-statistique-khi-deux-t191907.html
Bon, d'abord il faut savoir que le test du Khi² est basé (forcément) sur la loi normale. Si j'en crois mes lectures, il a été mis au point au début du XXè, peut-être suggéré par Mendel, pour simplifier les calculs, puisqu'il n'y avait pas de moyens simples, à l'époque, pour calculer. D'ailleurs, l'utilisation nécessite une table, ce qui parait surprenant à l'époque de l'informatique. Pourquoi pas l'enseigner aux étudiants pour des raisons historiques et éventuellement leur apprendre à manipuler des tables, mais l'utiliser comme moyen de base me parait surprenant.
Concernant le corps de l'énoncé. si les proportions nationales sont bonnes, c'est à dire indépendantes de toute autre variable que le hasard, les proportions observées sur un échantillon ne peuvent être que conforme aux proportions nationales. Par contre, si cet échantillon est pris dans un environnement particulier, par exemple une localisation et si on recherche une relation de cause à effet entre cet environnement et les proportions d'appartenance à un groupe sanguin alors, il faut le dire et l'énoncé a un sens.
Une réponse possible :
Les écarts entre les nombres observés et les nombres théoriques sont respectivement +17 -12 -13 +8.
Le taux d'écart acceptable dans l'énoncé est 5% ce qui représente 26 personnes.
On est donc largement dans les normes, c'est à dire que cet échantillon est représentatif. Rappelons que pour une quasi-certitude on aurait admis un écart pour 5 personnes.
On remarquera aussi que les écarts positifs et les écarts négatifs (17+8 = 12+13 = 25) sont même inférieurs à 26.

Il serait intéressant d'avoir la correction de l'auteur de cet exercice.
Bonne journée.

Dlzlogic

Messages : 1163
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Intervalle de confiance.

Message par Dlzlogic le Mar 23 Jan - 22:33

Bon, petit gag, le demandeur a posé la même question sur plusieurs forum, et il faut le reconnaitre seule la réponse de Gérard a apporté quelque-chose. Une fois n'est pas coutume, et je tiens à le signaler.
Naturellement ce que j'ai écrit dans mon précédent message tient toujours.
Demain je vais faire une simulation telle qu'on aura la solution chiffrée.
Comme je ne suis vraiment pas habitué au test du Khi² (je n'ai pas réussi, malgré mes recherches, à trouver la formule) j'aimerais bien que quelqu'un me donne le détail du calcul.
Bonne soirée.

Dlzlogic

Messages : 1163
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Intervalle de confiance.

Message par Dlzlogic le Mer 24 Jan - 11:17

Bonjour,
Comme prévu, voici une simulation. Pour une comparaison plus facile, je l'ai faite avec 525 personnes, comme dans l'énoncé. On vérifie que les écarts observés (+17, -12, -13, +8 ) dans l'échantillon de l'énoncé sont inférieurs à 2 écart-type. Donc, l"échantillon est significatif. En d'autres termes, il n'y a pas eu d'évènement autres que le hasard.  
Code:
Groupe O Moyenne nationale 44.5%
Nombre = 100  Moyenne = 234.43  emq=11.66  ep=7.77
Médiane = 235   min= 210  max=261
Classe 1  nb=   0  0.00%   théorique 0.35% |
Classe 2  nb=   4  4.00%   théorique    2% |HHHH
Classe 3  nb=   5  5.00%   théorique    7% |HHHHH
Classe 4  nb=  19  19.00%  théorique   16% |HHHHHHHHHHHHHHHHHHH
Classe 5  nb=  20  20.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHH
Classe 6  nb=  24  24.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHHHHHH
Classe 7  nb=  18  18.00%  théorique   16% |HHHHHHHHHHHHHHHHHH
Classe 8  nb=   9  9.00%   théorique    7% |HHHHHHHHH
Classe 9  nb=   1  1.00%   théorique    2% |H
Classe 10 nb=   0  0.00%   théorique 0.35% |

Groupe A Moyenne nationale 44.0%
Nombre = 100  Moyenne = 232.88  emq=11.46  ep=7.64
Médiane = 234   min= 210  max=268
Classe 1  nb=   0  0.00%   théorique 0.35% |
Classe 2  nb=   0  0.00%   théorique    2% |
Classe 3  nb=   9  9.00%   théorique    7% |HHHHHHHHH
Classe 4  nb=  18  18.00%  théorique   16% |HHHHHHHHHHHHHHHHHH
Classe 5  nb=  20  20.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHH
Classe 6  nb=  29  29.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Classe 7  nb=  16  16.00%  théorique   16% |HHHHHHHHHHHHHHHH
Classe 8  nb=   6  6.00%   théorique    7% |HHHHHH
Classe 9  nb=   1  1.00%   théorique    2% |H
Classe 10 nb=   1  1.00%   théorique 0.35% |H

Groupe B Moyenne nationale 8.05%
Nombre = 100  Moyenne = 39.93  emq=5.89  ep=3.93
Médiane = 41   min= 24  max=55
Classe 1  nb=   1  1.00%   théorique 0.35% |H
Classe 2  nb=   2  2.00%   théorique    2% |HH
Classe 3  nb=   9  9.00%   théorique    7% |HHHHHHHHH
Classe 4  nb=  13  13.00%  théorique   16% |HHHHHHHHHHHHH
Classe 5  nb=  21  21.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHHH
Classe 6  nb=  27  27.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHHHHHHHHH
Classe 7  nb=  18  18.00%  théorique   16% |HHHHHHHHHHHHHHHHHH
Classe 8  nb=   6  6.00%   théorique    7% |HHHHHH
Classe 9  nb=   3  3.00%   théorique    2% |HHH
Classe 10 nb=   0  0.00%   théorique 0.35% |

Groupe AB Moyenne nationale 3.5%
Nombre = 100  Moyenne = 17.76  emq=4.32  ep=2.88
Médiane = 17   min= 7  max=30
Classe 1  nb=   0  0.00%   théorique 0.35% |
Classe 2  nb=   1  1.00%   théorique    2% |H
Classe 3  nb=   5  5.00%   théorique    7% |HHHHH
Classe 4  nb=  21  21.00%  théorique   16% |HHHHHHHHHHHHHHHHHHHHH
Classe 5  nb=  23  23.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHHHHH
Classe 6  nb=  29  29.00%  théorique   25% |HHHHHHHHHHHHHHHHHHHHHHHHHHHHH
Classe 7  nb=   9  9.00%   théorique   16% |HHHHHHHHH
Classe 8  nb=   7  7.00%   théorique    7% |HHHHHHH
Classe 9  nb=   4  4.00%   théorique    2% |HHHH
Classe 10 nb=   1  1.00%   théorique 0.35% |H

Dlzlogic

Messages : 1163
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Intervalle de confiance.

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum