TRAVAIL SUR INTERNET

TRAVAIL SUR INTERNET

| statistiques

 

Séries statistiques    

 

 

1°)Définition     retour

La statistique étudie certaines caractéristiques : caractères ou variables d'un ensemble fini appellé population. Les éléments de cette population étudiée sont appelés individus.


2°)Type de variables     retour


2.1°)Définition

Une variable peut être :

  • Quantitative : numérique et fait l'objet de calcul  ( âge, taille, poids, notes, nombres d'heures etc ...)
  • Qualitative : c'est le contraire de quantitative, mais la variable peut très bien être numérique.
  • Discrète : si la variable ne prend qu'un nombre fini de valeurs (ces valeurs sont appelées modalités et notées xi ) .
  • Continue : si la variable prend ses valeurs dans un intervalle (classe )

 

2.2°) Exemple

Supposons que l'on veut faire une étude statistique sur les 50 notes attribuées par un jury à un examen.

On dispose pour cette étude de la liste des notes obtenues :


On peut regrouper ces notes par ordre croissant :

0,1,1,2,2,3,3,3 ..., et construire le tableau suivant : ( dans ce cas la distribution est discrète )

 



Ou bien regrouper ces notes par intervalle ( classe ) :

( dans ce cas la distribution est continue )

Exemple de regroupement par classe :

 

3°)Effectif     retour

L'effectif d'une classe ou d'une modalité est le nombre d'individu de  cette classe ou de cette modalité. Généralement on note ni est l'effectif de la classe n°  i ( ou de la modalité xi ).

L'effectif total est la somme des effectifs de toutes les classes.
On le note souvent N, on a alors : N = n1 + n2 + n3 + n4 + n5 = 50 . En utilisant la notation sigma





4°)Fréquence     retour


4.1°) Définition

La fréquence fi de la classes i ou de la modalité xi est le rapport fi/N , la fréquence d'une classe est un nombre de l'intervalle [0 ;1]

L'effectif cumulé d'une modalité est la somme des effectifs des modalités qui lui sont inférieures ou égales 

La fréquence cumulée d'une modalité est la somme des fréquences des modalités qui lui sont inférieures ou égales 


4.2°) Exemples :

Dans le cas "variable discrète" on obtient :

 

 

  • 3 personnes ont une note inférieure ou égale à 1 .
  • 15 personnes ont une note inférieure ou égale à 6 .
  • 47 personnes ont une note inférieure ou égale à 18 .
  • etc...

 



Dans le cas "variable continue" on obtient :


 



5°) Etendue d'une série statistique     retour

5.1°) Définition:

L'étendue d'une série statistique est la différence entre la plus grande modalité du caractère et la plus petite modalité.


5.2°) Exemple:



20 - 0 = 20, 
20 est l'étendue de ces deux séries ( continue et discrète )






6°) Mode d'une série statistique     retour

6.1°) Définition:

Dans le cas d'une série statistique
continue, la classe modale est la classe du plus grand effectif :


6.2°) Exemple:



 

Sur cette exemple, la classe modale est donc



Dans le cas d'une série statistique discrète, le mode est la valeur de plus grand effectif : 


 



7°) Moyenne     retour


7.1°) Définition

  • n1, n2, n3, .........,nN sont les effectifs correspondants aux modalités x1, x2, x3, .........,xN., si la série est discrète ,
  • ou les centres de chaque classe, si la série est continue.


7.2°) Exemple:

Série discrète

Série continue

 


7.3°) Propriétés de la moyenne:

  • Considérons une série statistique S de modalités x1, x2, x3, .........,xN affectées des effectifs n1, n2, n3, ... ,nN de moyenne ,
    et la série statistique S' de modalités y1, y2, y3, ... ,yN affectées des même effectifs n1, ... ,nN telle que pour tout i appartenant à {1 ; 2 ; ... ; N } :

yi = axi + b.



Alors: la moyenne de la série statistique S' est telle que :
                
= a + b.


  • Soient S1 et S2 deux séries statistiques d'effectifs totaux respectifs N1 et N2 et de moyennes respectives et .
    Alors la moyenne de la série S regroupant les deux séries S1 et S2 est :
       
    = [N1 + N2 ]/(N1 + N2).   (cette propriété se généralise).

 





8°) Variance et écart type     retour


8.1°) Définition

  
8.1.a°)



Pour calculer la variance d'une série statistique on utilise la formule :


Pour calculer la variance , il faut  calculer d'abord la moyenne.


  
8.1.b°)


La variance peut être calculée aussi en utilisant la formule :



Preuve:




8.2°) Ecart-type:

L'écart-type est le nombre noté
tel que : .

Le coefficient de dispersion est le rapport écart-type moyenne  :
/x

 

 

 

8.3°) Propriété de l'écart type :

 

  • Considérons une série statistique S de modalités x1, x2, x3,...,xN affectées des effectifs n1, n2, n3, ...,nN d'écart type ,
    et la série statistique S' de modalités y1, y2, y3, ...,yN affectées des mêmes effectifs n1,n2,n3, ...,nN telle que, pour tout i appartenant à {1 ; 2 ; ...; N } :

yi = axi + b.



Alors l'écart type : de la série statistique S' est tel que : = |a|





9°) Médiane     retour

9.1°) Définition

La médiane est un paramètre de position, qui permet de couper la population étudiée en deux groupes contenant le même nombre d'individus.
Ce paramètre est utile pour donner la répartition du caractère étudié,
car 50 % environ de la population étudiée a une modalité inférieure à la médiane et 50 % une modalité supérieure à la médiane.



9.2°) Exemple

On fait une étude statistique sur les 50 notes attribuées par un jury à un examen, voici les résultats obtenus en classant ces notes par ordre croissant.

Variable discrète

Utilisons la colonne des effectifs cumulés pour déterminer la médiane : il y a 50 notes, la  25ème note est 9 et la 26ème : 10.

Voici la répartition des notes :

Dans le tableau il n'y a pas de valeur partageant la série statistique en deux groupe de même effectif , ( l'effectif total est pair ) dans ce cas l'intervalle médian est [9;10] et on prendre pour médiane le centre de cet intervalle : 9,5



Variable continue

Si la variable est continue ( regroupement par intervalle des résultats )  le calcul de la médiane se fait autrement :


Utilisons la colonne des effectifs cumulés pour déterminer la médiane : Il y a 50 notes, 50 % de l'effectif total c'est 25, la médiane est ici la note correspondant à l'effectif cumulé 25.

 

D'après la colonne "effectif cumulé" :

  • 18 personnes  ont moins de 8
  • 30 personnes ont moins de 12

La médiane se trouve donc dans l'intervalle [8;12[ ( appelé classe médiane ). On le détermine par interpolation linéaire.





Les points A, M, B sont alignés ce qui se traduit par les droites (AM) et (AB) ont même coefficient directeur (ou on utilise le théorème de Thalès dans le triangle bleu ) :

 





La médiane est environ 10,33

50 % environ des personnes ont eu moins de 10,33 et 50 % plus de 10,33 .





10°) Interpolation linéaire     retour


11.1°) Définition:

Soit f une fonction définie sur
, [a; b] un intervalle de et c un nombre réel . Quand il n'est pas possible de calculer l'image de c par f , on utilise une interpolation linéaire, cela consiste à remplacer f(c) par g(c) ou g est la fonction affine telle que : g(a) = f(a) et g(b) = f(b)

Cela consiste à remplacer la courbe représentative de f sur [a; b] par la droite (AB)  ( On dit que l'on a déterminé f(c) par interpolation linéaire.



11.2°) Exemple:

L'interpolation linéaire est utilisée surtout en statistique

Le mieux est de comprendre sur un exemple :

.


Supposons que l'on étudie la répartition des âges dans une association par exemple.
D'après le tableau ci-dessus on a : 

  • 14 personnes qui ont un âge compris entre 0 et 10 ans
  • 32 personnes qui ont un âge compris entre 10 et 20 ans
  • etc...

La colonne des effectifs cumulés croissants nous permet de savoir que :

  • 14 personnes ont un âge inférieur à 10 ans
  • 46 personnes ont un âge inférieur à 20 ans
  • etc...

Supposons maintenant que l'on a ordonné ces personnes par ordre croissant de leur âge ( du plus jeunes au plus vieux) et que l'on veuille trouver par interpolation l'âge de la 72 ème personne.

On repère à l'aide de la colonne des effectifs cumulés croissants dans quelles tranches d'âge ce trouve cette personne.



La 72 ème personne a entre 20 et 30 ans c'est sûr , mais cela ne suffit pas ...


On considérant que les 55 personnes de la tranche [20;30[ sont réparties de manière proportionnelle :

  • la 46ème personne a moins de 20 ans, faisons comme si elle en avait 20 
  • la 101 ème personne a moins de 30 ans faisons comme si elle en avait 30


Ces deux schémas ci-dessous devraient vous aider à comprendre :







Utilisons Le théorème de Thalès dans le triangle bleu.

La 72 ème personne a presque 25 ans.

 

© Math Web Copyright J. LEVY

 


Site créé gratuitement grâce à OnlineCreation.me


Tous droits réservés