Dans le cours : Utiliser SQL pour l'analyse de données

Accédez à ce cours grâce à un essai gratuit

Inscrivez-vous aujourd’hui pour accéder à plus de 24 900 cours dispensés par des experts.

Comprendre la distribution des données

Comprendre la distribution des données

Il peut être utile d'analyser la distribution des valeurs dans un groupe, pour observer statistiquement les différents éléments de ce groupe et voir le rapport que ces éléments ont entre eux. On peut notamment chercher à comprendre la structure de nos données et la variabilité de ces données à travers le temps. Et pour ça, on peut chercher quelle est la distribution des fréquences qui montrerait combien de fois chaque valeur apparaît dans un ensemble. Mais pour ça, il faudrait calculer une liste de valeurs et le pourcentage de leur apparition, et ici, on va plutôt travailler d'une manière statistique pour chercher quelle est la dispersion des données dans la distribution. C'est-à-dire, la dispersion, c'est le rapport entre les différentes valeurs entre elles, et aussi par rapport à une moyenne, ou à une médiane, ou à certaines positions dans la distribution. Il y a deux mesures qui aident à comprendre cette dispersion. C'est ce qu'on appelle l'écart-type, qu'on a ici, et la variance…

Table des matières