Chapitre 11

Statistiques

Calcul de la note du BAC 2022

Infographie

Résultats

Matières Français Oral Français Ecrit Spé 1ère Hist. Géo. LV A LV B Ens. Sci. E.P.S
Coefficient 5 5 8 6 6 6 6 6
Notes 10 8 12 13 14 12 6 16


Matières E.M.C Spe 1 Spe 2 Philosophie Grand Oral
Coefficient 2 16 16 8 10
Notes 12 9 13 15 9

Résultats

Quelle est la note final de ce candidat ?

Moyenne pondérée

Pour calculer la moyenne pondérée d'une série statistique de nombres affectés chacun d'un coefficient qui représente son poids, comme la moyenne de notes coefficientées, il faut calculer la somme des produits de chaque valeur avec leur poids puis la diviser par la somme des poids.

\overline{x} = \dfrac{p_1x_1 + p_2x_2 + \ldots + p_nx_n}{p_1 + p_2 + \ldots + p_n}
\overline{x} = \dfrac{p_1x_1 + p_2x_2 + \ldots + p_nx_n}{p_1 + p_2 + \ldots + p_n}

\overline{x} = \dfrac{10 \times 5 + 8 \times 5 + 12 \times 8 + 13 \times 6 + 14 \times 6 + 12 \times 6 + 6 \times 6 + 16 \times 6 + 12 \times 2 + 9 \times 16 + 13 \times 16 + 15 \times 8 + 9 \times 10}{ 5 + 5 + 8 + 6 + 6 + 6 + 6 + 6 + 2 + 16 + 16 + 8 + 10 }

\overline{x} = \dfrac{1138}{100}

\overline{x} = 11,38

Comparaison de 2 séries

Voici les différentes notes obtenues par 2 groupes distingues. Groupe 1 (18 élèves)
11 ; 14 ; 14 ; 14 ; 15 ; 16 ; 9 ; 10 ; 11 ; 11 ; 8 ; 7 ; 15 ; 7 ; 11 ; 13 ; 15 ; 12

Groupe 2 (21 élèves)
16 ; 19 ; 17 ; 8 ; 3 ; 7 ; 18 ; 6 ; 19 ; 5 ; 17 ; 16 ; 6 ; 3 ; 19 ; 20 ; 8 ; 20 ; 4 ; 13 ; 4

Comment comparer les résultats de ces 2 groupes.

Indice de position

Moyenne simple

La moyenne est un indicateur de position qui permet de résumer l'information fournie par un ensemble de données statistiques.
Elle est égale à la somme de ces données divisée par leur effectif (nombre de valeurs de la serie).

\overline{x} = \dfrac{x_1 + x_2 + \ldots + x_n}{n}

Moyenne

Groupe 1
\overline{g_1} = \dfrac{11 + 14 + 14 + 14 + 15 + 16 + 9 + 10 + 11 + 11 + 8 + 7 + 15 + 7 + 11 + 13 + 15 + 12}{18}
\overline{g_1} = \dfrac{213}{18}
\overline{g_1} \approx 11,8

Groupe 2
\overline{g_2} = \dfrac{16 + 19 + 17 + 8 + 3 + 7 + 18 + 6 + 19 + 5 + 17 + 16 + 6 + 3 + 19 + 20 + 8 + 20 + 4 + 13 + 4}{21}
\overline{g_2} = \dfrac{248}{21}
\overline{g_2} \approx 11,8

Conclusion

La moyenne est un indicateur relativement facile à calculer, en revanche il n'est pas toujours suffisant pour annalyer ou comparer des séries statistiques.

La médianne

Médianne

La médiane est une valeur qui partage un ensemble de valeurs ordonné en deux parties d’effectifs égaux.
Ainsi, pour un ensemble de notes, 50 % des notes se situent sous la médiane et 50 % au-dessus.
La médianne comme la moyenne sont des indicateurs de position.

Exercice

Groupe 1 :
Ensemble de notes ordonné :
7 ; 7 ; 8 ; 9 ; 10 ; 11 ; 11 ; 11 ; 11 ; 12 ; 13 ; 14 ; 14 ; 14 ; 15 ; 15 ; 15 ; 16
Le demi-effectif est 9 ( \dfrac{18}{2}), on crée donc 2 groupes de 9 notes
\textcolor{red}{7 ; 7 ; 8 ; 9 ; 10 ; 11 ; 11 ; 11 ; 11 }; \textcolor{green}{12 ; 13 ; 14 ; 14 ; 14 ; 15 ; 15 ; 15 ; 16}
La medianne est une valeur entre 11 et 12, on prendra généralement la moyenne de ces 2 valeurs.
m_1= 11,5

Exercice

Groupe 2 :
Ensemble de notes ordonné :
3; 3; 4; 4; 5; 6; 6; 7; 8; 8; 13; 16; 16; 17; 17; 18; 19; 19; 19; 20; 20
Le demi-effectif est 10,5 ( \dfrac{21}{2}), on créer donc 2 groupes de 10 notes.
\textcolor{red}{3; 3; 4; 4; 5; 6; 6; 7; 8; 8 }; 13; \textcolor{green}{ 16; 16; 17; 17; 18; 19; 19; 19; 20; 20}
La medianne est la valeur entre ces 2 groupes.
médianne = 13

Indices de dispersion

Etendue

L'étendue represente la dispersion de la série. C'est la différence entre la valeur maximum de la série et la valeur minimum de la série.

Calcul de l'étendue

Groupe 1 :
Minimum :
maximum :
Etendu :

Groupe 2 :
Minimum :
maximum :
Etendu :

Espace interquartile

L'espace interquatile est un indicateur de dispersion autour de la médianne.
Il est définie par la différence entre le 1ème et le 3ème quartile.
Pour le calculer il faut donc connaitre les 1er et 3 ème quartiles.

Exemple

Le premier quartile (noté généralement Q1) est la première valeur de la serie tel que 25% (1/4) des valeurs de la serie soient en dessous ;
le troisième quartile (noté généralement Q3) est la première valeur de la serie tel que 75% (3/4) des valeurs de la serie soient en dessous.


L'espace interquartile est donc Q_3 - Q_1

Exercice: Espace intarquatile Groupe 1

7 ; 7 ; 8 ; 9 ; 10 ; 11 ; 11 ; 11 ; 11 ; 12 ; 13 ; 14 ; 14 ; 14 ; 15 ; 15 ; 15 ; 16
La position Q_1 de 5 ( \dfrac{18}{4} = 4,5)
La position Q_3 de 14 ( 3 \times \dfrac{18}{4} = 13,5)
7 ; 7 ; 8 ; 9 ; \textcolor{red}{10} ; 11 ; 11 ; 11 ; 11 ; 12 ; 13 ; 14 ; 14; \textcolor{green}{14} ; 15 ; 15 ; 15 ; 16
La medianne est une valeur entre 11 et 12, on prendra généralement la moyenne de ces 2 valeurs.
Q_1 = 10
Q_3 = 14
EI = 14 - 10 = 4

Exercice: Espace intarquatile Groupe 2

3; 3; 4; 4; 5; 6; 6; 7; 8; 8; 13; 16; 16; 17; 17; 18; 19; 19; 19; 20; 20
La position Q_1 de 6 ( \dfrac{21}{4} = 5,25)
La position Q_3 de 16 ( 3 \times \dfrac{21}{4} = 15,75)
3; 3; 4; 4; 5; textcolor{red}{6}; 6; 7; 8; 8 ; 13; 16; 16; 17; 17; \textcolor{green}{18}; 19; 19; 19; 20; 20
Q_1 = 6
Q_3 = 18
EI = 18 - 6 = 12

Variance et écart-type

Variance

La variance, habituellement notée V(X), est définie comme la moyenne du carré des écarts à la moyenne des valeurs de la distribution.
V(X)=\dfrac{ (x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + \ldots + (x_k - \overline{x})^2}{k}

En cas de série pondérée.
V(X)=\dfrac{ n_1(x_1 - \overline{x})^2 + n_2(x_2 - \overline{x})^2 + \ldots + n_k(x_k - \overline{x})^2 }{n_1 + n_2 + \ldots + n_k}

écart-type

L'écart-type, noté \sigma(X) , est la racine carrée de la variance.
\sigma(X)=\sqrt{V(x)}

Exercice: Variance et écart type Groupe 1

Série : 7 ; 7 ; 8 ; 9 ; 10 ; 11 ; 11 ; 11 ; 11 ; 12 ; 13 ; 14 ; 14 ; 14 ; 15 ; 15 ; 15 ; 16
Moyenne : \overline{x} = 11,8

V(X) = \dfrac{(7-11,8)^2 + ( 7-11,8)^2 + ( 8-11,8)^2 + \ldots + ( 16-11,8)^2}{18}
V(X) = \dfrac{138,5 }{18} = 7,694

\sigma(X) = \sqrt{7,694} = 2,774

Exercice: Variance et écart type Groupe 2

Série : 3; 3; 4; 4; 5; 6; 6; 7; 8; 8; 13; 16; 16; 17; 17; 18; 19; 19; 19; 20; 20
Moyenne : \overline{x} = 11,8

V(X) = \dfrac{(3-11,8)^2 + ( 3-11,8)^2 + ( 4-11,8)^2 + \ldots + ( 20-11,8)^2}{18}
V(X) = \dfrac{861,238 }{18} = 41,01

\sigma(X) = \sqrt{41,01} = 6,4

Coupe du monde 2010

Le tableau ci-dessous représente le nombre de buts par match lors de la coupe du Monde 2010.
Nombre de buts x_i 0 1 2 3 4 5 6 7
Nombre de match n_i 7 17 13 14 8 6 0 1

  • Déterminer la moyenne de cette série
  • Déterminer la médiane de cette série
  • Déterminer l'espace interquartile de cette série.
  • Déterminer la variance et l'écart-type de cette série.

Choisir son établissement scolaire

Lycée A
Taux de réussite :
  • Générale : 92%
  • Technologique : 70%

Nombre d'élèves
  • Générale : 250
  • Technologique : 500
Lycée B
Taux de réussite :
  • Générale : 88%
  • Technologique : 50%

Nombre d'élèves
  • Générale : 640
  • Technologique : 120

Effectifs cumulés croissants

L’effectif cumulé croissant (noté E.C.C.) d’une valeur est égal à la somme de l’effectif de cette valeur plus les effectifs des valeurs qui lui sont inférieures.

Compléter le tableau ci-dessous.

Salaire 1500 1600 1800 2000 2300 2500
Effectif 25 34 51 31 24 12
E.C.C.

Le tableau ci-dessous donne le nombre de but marqués par match durant un tournoi de football.

Nombre de buts 0 1 2 3 4 5 6 7 8
Nombre de matchs 3 4 7 9 6 3 4 1 3
E.C.C.

  1. Compléter le tableau
  2. Déterminer l'effectif total
  3. Déterminer la position de la médiane
  4. Déterminer la position du premier quartile
  5. Déterminer la position du troisième quartile

On a relevé, dans un jeu télévisé, le nombre de candidats ayant répondu correctement à une liste de questions.

Nombre de réponses 1 2 3 4 5 6 7 8 9 10
Effectifs 1 2 5 8 15 45 32 21 9 2
E.C.C.

  1. Compléter le tableau
  2. Déterminer l'effectif total
  3. Déterminer la médiane
  4. Déterminer le premier quartile
  5. Déterminer le troisième quartile