Comment Blue calcule-t-il les mesures de tendance centrale ?
En statistique, une tendance centrale (ou une mesure de tendance centrale) est une valeur qui tente de décrire un ensemble de données en identifiant la position centrale au sein de cet ensemble. La moyenne (souvent appelée « moyenne arithmétique ») est une mesure courante de la tendance centrale que vous connaissez peut-être, mais il en existe d'autres, telles que la médiane, la médiane interpolée et le mode.
La tendance centrale d'une distribution est généralement opposée à sa dispersion ou variabilité (Comment Blue calcule-t-il les mesures de dispersion ?) ; la dispersion et la tendance centrale sont les propriétés souvent caractéristiques des distributions. Les analystes peuvent juger si les données ont une tendance centrale forte ou faible en fonction de leur dispersion.
La moyenne, la médiane et le mode sont tous des mesures valables de la tendance centrale, mais dans certaines conditions, certaines mesures de la tendance centrale sont plus appropriées que d'autres.
- Lorsque vous disposez d'un échantillon normalement distribué, vous pouvez légitimement utiliser la moyenne ou la médiane comme mesure de la tendance centrale. La moyenne, la médiane et le mode sont égaux dans toute distribution symétrique.
- Cependant, lorsque les données sont asymétriques, la moyenne est influencée par l'asymétrie. Dans ces situations, la médiane est généralement considérée comme la meilleure représentante de la position centrale des données. Plus la distribution est asymétrique, plus la différence entre la médiane et la moyenne est grande, et plus il convient de privilégier l'utilisation de la médiane plutôt que de la moyenne.
- Si les données ne sont pas normales, il est d'usage d'utiliser la médiane plutôt que la moyenne. Cependant, il s'agit davantage d'une règle empirique que d'une directive stricte. Parfois, les analystes souhaitent rapporter la moyenne d'une distribution asymétrique si la médiane et la moyenne ne sont pas sensiblement différentes (évaluation subjective) et si cela permet de faciliter les comparaisons avec les recherches précédentes.
Calculs Blue
Moyenne
L'une des mesures les plus courantes de la tendance centrale est la moyenne. Dans Blue, elle est calculée en additionnant les scores des réponses et en divisant la somme par le nombre de réponses. Par exemple, la moyenne pour l'ensemble de réponses suivant 3,4,6,6,7 serait calculée comme suit :

Médiane
La médiane est la valeur centrale d'une liste ordonnée de réponses. Dans l'exemple ci-dessus, la valeur médiane serait 6. La valeur médiane d'un ensemble pair de valeurs est obtenue en calculant la moyenne des deux nombres centraux.
Médiane interpolée
La médiane interpolée fournit une autre mesure du centre, qui tient compte du pourcentage de données strictement inférieures ou strictement supérieures à la médiane. La médiane interpolée (MI) ajuste légèrement la médiane à la hausse ou à la baisse, selon que la distribution est plus fortement pondérée au-dessus ou en dessous de la médiane (c'est-à-dire dans la direction où les données sont plus fortement pondérées), en pondérant les réponses à l'aide de la formule suivante où ! = médiane, ! = nombre de scores inférieurs à ! , ! = nombre de scores égaux à ! , et  = nombre de réponses supérieures à
.
Si
, alors :

Par exemple, la médiane interpolée de 3,4,6,6,7 = 6 (1-2)/ (2*2)=5,75
Si
, alors :

Blue calcule la médiane interpolée à l'aide de deux formules équivalentes, principalement dans le but d'améliorer l'efficacité, puisque nous connaissons déjà la valeur de
:


où
= nombre total de réponses, 
Pour plus d'informations sur la médiane interpolée, consultez les ressources suivantes :
- The Interpolated Median, Administration Evaluation, University of Michigan (http://aec.eecs.umich.edu/median.php)
- Murray, James M, PhD. (2018) Median and Interpolated Median (https://murraylax.org/rtutorials/medians.pdf)
Mode
Le mode est simplement la valeur la plus fréquente dans un ensemble de réponses. Le mode pour les données d'exemple sur lesquelles nous avons travaillé est 6, car il apparaît deux fois dans la liste, tandis que les autres ne apparaissent qu'une seule fois. Si, dans l'ensemble de données, aucune des valeurs n'apparaît plus d'une fois, alors il n'y a pas de mode pour cet ensemble de données. Si plusieurs valeurs apparaissent le plus grand nombre de fois, alors il y a plusieurs modes.
Disponible dans les blocs de rapport Blue
Vous trouverez ci-dessous les mesures de tendance centrale pour les types de questions applicables :
Sélection unique
- Question - Fréquence
- Question - Score
- Question - Feuille de calcul
Tableau à sélection unique
- Question - Fréquence
- Question - Score
- Question - Feuille de calcul
Mise en œuvre dans les rapports Blue
- Dans un bloc de rapport Question - Fréquence représentant une question à sélection unique, activez Afficher les statistiques, puis sélectionnez la moyenne, le mode et la médiane comme vous le souhaitez. Si vous incluez une médiane, choisissez soit la médiane, soit la médiane interpolée dans la liste déroulante.

- Dans un bloc de rapport Question - Fréquence pour un tableau à sélection unique, vous pouvez activer Afficher les statistiques de compétence pour calculer des statistiques telles que la moyenne globale, le mode, la médiane ou la médiane interpolée pour toutes les questions du tableau.

- Pour un bloc de rapport Question - Score, vous devez sélectionner Afficher le tableau, puis activer la moyenne ou la médiane. Si vous utilisez la médiane, choisissez entre Médiane simple et Médiane interpolée.

- Pour un bloc de rapport Question - Feuille de calcul, vous pouvez inclure la moyenne, le mode, la médiane ou la médiane interpolée dans un seul bloc. Pour ajouter des statistiques au bloc feuille de calcul, sélectionnez la valeur dans la liste déroulante Élément, puis sélectionnez Ajouter .

Recommandations
Le défi du reporting consiste à choisir les mesures statistiques appropriées pour les données. Voici quelques recommandations pour atténuer ce problème :
- Utilisez un bloc Question - Fréquence pour afficher la distribution des réponses, ainsi que la moyenne, le mode et la médiane
- Utilisez un bloc Question - Score ou Question - Tableur pour afficher les mesures de tendance centrale et les mesures de dispersion pertinentes pour votre établissement.
- Si vous utilisez uniquement la moyenne, comparez-la à d'autres moyennes au sein de l'organisation en utilisant des éléments de groupe pour les départements, les divisions, etc.
Moyenne des groupes d'évaluateurs
Dans Blue, la moyenne de plusieurs groupes d'évaluateurs combine d'abord ces groupes multiples, puis calcule la moyenne de la population combinée.
L'exception est un bloc de score pour ceux qui s'intéressent à la moyenne des moyennes des groupes d'évaluateurs. Dans les blocs de rapport Question - Score, Moyenne des groupes d'évaluateurs crée la moyenne en calculant la moyenne pour chaque groupe d'évaluateurs, puis en calculant la moyenne globale en prenant la moyenne des moyennes.
La moyenne des moyennes est-elle égale à la moyenne de tous les nombres initialement moyennés ?
La réponse correcte est que cela dépend. La moyenne des moyennes n'est égale à la moyenne de toutes les valeurs que dans deux cas :
- Si le nombre d'éléments de tous les groupes est le même
- Le cas trivial où toutes les moyennes des groupes sont égales à zéro
Dans le premier cas, considérons deux ensembles
et ! et leurs moyennes. Le raisonnement suivant peut être étendu à n'importe quel nombre de groupes.

La moyenne des moyennes est :

Considérons maintenant l'ensemble du groupe :
et sa moyenne :

Dans le cas général, nous pouvons voir que ces moyennes sont différentes :

Cependant, si nous faisons
, nous obtenons :

C'est pourquoi la moyenne des moyennes est égale à la moyenne de l'ensemble du groupe lorsque les groupes ont la même taille.
Le deuxième cas est trivial : 
Bien que la moyenne des moyennes (étayée par la moyenne des groupes d'évaluateurs dans le bloc de rapport « Blue Question - Score report ») ne soit pas erronée, elle nécessite une interprétation statistique prudente (en gardant à l'esprit un paradoxe tel que le paradoxe de Simpson - « La signification pratique du paradoxe de Simpson apparaît dans les situations de prise de décision où il pose le dilemme suivant : quelles données devons-nous consulter pour choisir une action, les données agrégées ou les données partitionnées ? »).
DansCréation du rapport initial