Un peu de statistique

Aller en bas

Un peu de statistique

Message par Dlzlogic le Jeu 5 Avr - 14:37

Bonjour,
Réf. http://www.les-mathematiques.net/phorum/read.php?13,1636462
Encore une question très intéressante de ce membre que malheureusement ne reçoit pas souvent de réponse.
D'abord, on peut remarquer que l'approche du problème est bien faite : il élimine les articles douteux.
J'irai même un peu plus loin, pour les séries numériques pour lesquelles on peut considérer que les valeurs sont aléatoires, typiquement le salaire, j'éliminerai sans arrière pensée les articles dont la valeur a un écart de plus de 3 écarts-type. Ceci est particulièrement ma réponse concernant la note. On n'a aucune information sur la façon dont cette note est établie, recopiée ou je ne sais quoi. Si elle dépasse 3 écart-type, en plus ou en moins, alors elle est aberrante.

Concernant le type de données :
Voici comment j'ai raisonné, je me demande d'abord quels types de variables je dispose:
On a:
* des données quantitatives
- discrètes: âge,exp
- continues: salaire, note
* des données qualitatives
- nominale: cheveux, specialite, sexe,dispo, embauche
- ordinale: diplome
Il n'y a aucune différence concernant les bases des probabilités et l'application présente, la statistique, entre des données discrètes et des données continue.
Pour les données qualitatives, c'est un peu plus compliqué.
Par exemple la couleur de cheveux ne pourrait avoir un intérêt, à mon avis, que par comparaison à la moyenne nationale.
Pour la spécialité, pour obtenir des résultats exploitables, je scinderais la liste pour en faire autant de sous-liste par spécialité.
Pour le sexe, cela me parait être une étude à part : quels que soient les autre critères, on veut comparer celui-là.
Concernant l'embauche, tel que présenté, pour moi c'est la variable à expliquer, toutes les autres sont des variables explicatives. Comme en conclusion de l'étude on aura, pour chaque spécialité une formule du type Y = f(...) où Y est l'embauche, je transformerai la valeur 0 ou 1 en variable réelle de 0 à 100. Bien sûr en données, ce ne pourra être que 0 ou 1 mais la formule crée aura un résultat de 0 à 100 qui pourra être considéré comme pourcentage.
Pour le diplôme, je transformerais ça en nombre d'années d'étude, par exemple.

La courbe des ages présente une anomalie qu'il faut identifier et expliquer ou corriger.

Les 4 histogrammes suivants vérifient qu'il n'y a pas de faute, c'est à dire que la répartition est normale.

Personnellement je ferais un dernière étape : pour chaque spécialité, je ferais une régression avec toutes les variables. Ce qui permettrait de comparer les coefficients de chaque variable entre les différentes spécialités.

En bref, un sujet vraiment intéressant.


Dlzlogic

Messages : 1162
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Un peu de statistique

Message par Dlzlogic le Jeu 5 Avr - 17:31

Bon, je viens de voir que le demandeur du sujet ne connait pas la solution concernant les notes qui dépassent la borne maximum. Il est tout de même assez surprenant que personne ne lui réponde. Est-ce par ignorance ou pour une autre raison. Il est clair que d'une façon générale ce membre pose des questions précises et parfaitement justifiées, celles-ci dépassent-elle les capacité des ténors de ce forum ? Ou au contraire, ces questions seraient-elle à la limite de l'hérésie selon eux ?

Dlzlogic

Messages : 1162
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Un peu de statistique

Message par Dlzlogic le Jeu 5 Avr - 22:39

Bon, Gérard a fait une réponse, pas très constructive, puisqu'il dit "fais comme tu veux".
C'est normal de sa part, en effet, il n'a aucune idée des fondement des probabilités.
Puis, la presque totalité de son message est barré, qui l'a fait ? lui ou un modérateur ?
Toujours est-il que cet étudiant qui pose les bonnes questions n'a pas de réponse satisfaisante.
Il n'y a donc personne qui soit compétent et qui ait accès à ce forum ? Désolant.
Décidément, ça ne s'arrange pas.
Il semble que les ténors des forum, dans cette spécialité, ne se rendent pas compte que ce membre, très correct, qui pose des questions claires, joue gros jeu. Il me parait clair que cet exercice a été fabriqué pour tester les étudiants. Celui-ci demande de l'aide, pour quel motif lui refuserait-on ?
Bref je suis vraiment scandalisé.

Je viens de lire une petite réponse de Gérard à Marsup. C'est amusant (ou triste) dans le mesure où Gérard ignore complètement les lois et démonstrations relatives aux probabilités, base de tout calcul statistique.
De toute façon, connaissant Gérard, vu qu'il ne sait pas réfléchir il est impossible de lui expliquer quoi que ce soit.
Bonne soirée tout de même.

Dlzlogic

Messages : 1162
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Un peu de statistique

Message par Dlzlogic le Dim 15 Avr - 12:49

Bonjour,
Il y a d'autres questions provoquées par le même étudiant et probablement à partir du même exercice.
http://www.les-mathematiques.net/phorum/read.php?13,1639920
Le problème de l'indépendance, ou au contraire de la corrélation de deux variables est bien posé. C'est dans cet esprit que j'ai mis au point une méthode. Voir l'explication :
http://www.dlzlogic.com/aides/Lorenz_Gini.pdf

Dlzlogic

Messages : 1162
Date d'inscription : 04/07/2017
Age : 73
Localisation : Proville

Voir le profil de l'utilisateur http://www.dlzlogic.com

Revenir en haut Aller en bas

Re: Un peu de statistique

Message par Contenu sponsorisé


Contenu sponsorisé


Revenir en haut Aller en bas

Revenir en haut

- Sujets similaires

 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum