Les séries statistiques

Initiation aux séries statistiques discrètes

Remarque préalable : au sens strict, une série statistique est une suite de données individuelles. Donc, dès que des données sont regroupées sous forme de tableau, il ne s’agit plus d’une série statistique. Toutefois, cette page a été rédigée à l’attention des élèves de seconde pour qui cette distinction n’est pas de première importance. C'est pourquoi les deux situations seront vues ici.

 

Définitions

Une étude statistique porte sur des individus dont l’ensemble constitue la population. Un individu statistique n’est pas toujours un être humain et le terme d'unité statistique est souvent mieux adapté. Ce peut être une note, un pays, un relevé de température, bref, n’importe quoi. Le caractère (encore appelé variable statistique) est ce qui est observé sur chaque unité.

Ce caractère peut être qualitatif, discret ou continu (le cas continu ne sera pas traité ci-dessous mais en page de série statistique continue).

Un caractère qualitatif ne se mesure pas sur une échelle numérique. C’est par exemple une couleur ou une profession. Un caractère discret se mesure par des nombres entiers (ou avec un nombre limité de décimales) : nombre d’enfants, de clients… Un caractère continu peut prendre des valeurs intermédiaires (poids, prix…) mais on le traite parfois comme un caractère discret en arrondissant les vraies valeurs (l’âge, par exemple).

 

Avec calculatrice

À l'ère du big data, il faut souvent traiter de très nombreuses données, parfois des milliards. Bien entendu, elles n’existent que sous forme numérique. En classe de seconde, on traite un petit nombre de données avec une calculatrice. Nous verrons ici comment utiliser la TI-82 ou la TI-83. Pour un traitement manuel, voir l'exemple d'une série discrète. Avec une Casio : statistiques avec calculatrice Casio.

Dans un énoncé d’exercice, les valeurs d'une série sont séparées par des points-virgules. Par exemple, les nombres d’enfants d’une population de dix couples sont présentés ainsi : 0 ; 1 ; 2 ; 1 ; 3 ; 2 ; 0 ; 5 ; 2 ; 2.

famille

La série peut être ordonnée. On le fait pour calculer à la main certains indicateurs (médiane, quartiles, fréquences cumulées) mais si le calcul est informatique (ordinateur ou calculatrice), le tri est inutile. En l’occurrence, la série triée est : 0 ; 0 ; 1 ; 1 ; 2 ; 2 ; 2 ; 2 ; 3 ; 5.

Sur la calculatrice TI-82, touche stats puis optez pour le choix 1 (EDIT). Dans la colonne qui se présente (L1), tapez chaque valeur suivie d’entrer (ou flèche vers le bas) pour aller à la ligne. Une erreur se corrige par la touche suppr. Une série entière s’efface en remontant sur la ligne d’en-tête (L1), puis touche annul, puis entrer. Les écrans de la TI-83 illustrent la page statistiques avec TI, que nous vous recommandons de lire...

TI-82

Au cas où, voici comment trier ces valeurs dans l’ordre croissant : touche stats pour revenir au menu, puis, toujours dans le menu d’édition, choix 2 (TriA). Le choix 3 permettrait un tri par ordre décroissant. Lorsqu’on valide, la calculatrice affiche TriA( et l'on doit entrer le nom de la série. Ici, c’est L1. Attention, il ne faut pas taper la lettre L puis le chiffre 1 mais sur la touche 2nde puis sur la touche 1 (au-dessus de laquelle est imprimé L1 de la même couleur que la touche 2nde). On valide et la calculatrice nous indique que le travail est fait. Pour le vérifier, on peut revenir voir notre série (touche stats, choix 1, Entrer).

Un énoncé peut partir d’un tableau et non d’une série brute, surtout si la population est nombreuse. Dans la vie professionnelle également, on peut travailler soit à partir de données brutes, soit à partir de données regroupées. Les calculatrices gèrent aussi bien cette présentation que la précédente (ce qui n’est pas toujours le cas des logiciels).

Dans un tableau, on indique sur une première ligne les différentes valeurs que peut prendre le caractère et dans une seconde, le nombre de fois où cette valeur apparaît (en d’autres termes : l’effectif). Ici, nous aurions…

Nombre d’enfants 0 1 2 3 4 5
Nombre de couples 2 2 4 1 0 1

Précisons que la colonne qui correspond à quatre enfants est facultative puisqu’aucun couple de notre population n’a quatre enfants.

Nous vérifions que la somme des couples (seconde ligne) est bien égale à 10.

Dans les formules, les valeurs prises par le caractère sont notées \(x_i.\) Le \(i\) est un compteur. Par exemple, ici, \(x_1 = 0,\) \(x_2 = 1,\) etc. L’effectif qui correspond est noté \(n_i.\) Donc, ici, \(n_1 = 2,\) \(n_2 = 2,\) etc.

Dans l'éditeur statistique de votre calculatrice, entrez dans la colonne L1 les valeurs prises par le caractère (nombre d’enfants) et dans la colonne L2 les effectifs correspondants.

deux listes

Maintenant, quelles informations peut-on obtenir ? Les différents indicateurs sont la moyenne, l'écart-type, la médiane, les quartiles, l’étendue…  Ces notions sont largement traitées sur ce site web mais les pages qui les concernent ne sont pas toujours adaptées au niveau d’une classe de seconde. Pour la médiane, voir la page sur les fréquences.

L’étendue est la différence entre la valeur la plus grande et la plus petite. Dans notre exemple, \(5 - 0 = 5.\)

La première information est la moyenne pondérée. Habituellement, les enseignants demandent que soit posée la formule, même si le calcul est effectivement réalisé avec la fonction STAT de la calculatrice. Dans notre exemple :

\[\overline x = \frac{{(0 \times 2) + (1 \times 2) + (2 \times 4) + (3 \times 1) + (5 \times 1)}}{10} = 1,8\]

Pour obtenir les indicateurs d’une série statistique avec la TI-82, il faut se rendre dans le menu CALC (touche stats). Optez pour le choix 1 qui correspond à une série d’une variable (les autres choix ne font pas partie du programme de seconde, ni même de première, d’ailleurs). Dans le premier cas où chaque valeur est entrée individuellement et si les données figurent bien en colonne L1 , il suffit d'appuyer deux fois sur la touche Entrée pour obtenir les écrans de résultats (il y a deux écrans à la suite, voir plus bas). Dans le second cas (L1 et L2), appuyez sur Entrée une seule fois puis L1,L2 (la touche virgule n’est pas celle des décimales mais celle qui se situe au-dessus de la touche 7). Entrée.

écran 1

 écran 2

La première information est la moyenne (on retrouve bien 1,8), la suivante est la somme des \(x_in_i\) (c’est le numérateur de la formule), la troisième est la somme des carrés (inutilisée en seconde), les deux suivantes sont les écarts-types, n est l’effectif (très pratique pour s’assurer que toutes les données ont bien été entrées). Puis viennent le minimum, le premier quartile, la médiane, le troisième quartile et la valeur maximale. Attention, les définitions des quartiles Q1 et Q3 ne sont pas exactement les mêmes que celles du programme de seconde.

La calculatrice peut aussi dessiner des graphiques mais cette fonctionnalité n’est pas d’un grand intérêt…