ADV20_TRANSCRIPT – Bien utiliser le texte sur ses graphiques

TEASER: Quand on présente des données avec des graphiques le texte est un outil important pour nous permettre d’expliquer les points importants et de guider notre lecteur. Mais quand est-ce que trop c’est comme pas assez ?

INTRODUCTION : Ici Johanie Fournier et bienvenu à un nouvel épisode d’Agriculture, Données et Visualisation. Le podcast ou je vous apporte avec moi dans le processus de traitement et de visualisation de données pour apprendre à présenter vos propres données de la manière la plus efficace possible. Sans plus tarder, voici l’épisode de cette semaine.

Bonjour et bienvenu dans ce 20ième épisode. J’espère que vous allez bien et que vous être prêt parce qu’aujourd’hui on aborde la diversité raciale dans les écoles des États-Unis.

Les données de cette semaine proviennent du Washington Post. Le lien pour les télécharger ainsi que l’article en lien avec le sujet de cette semaine se trouve dans les liens que j’ai inclus dans les notes de l’épisode que vous pourrez trouver au johaniefournier.com/20 ou directement dans mon article de blog au johaniefournier.com/tyt2019-39.

Le Washington Post a utilisé des données de l’année scolaire 1994-1995, les plus anciennes données presque complètes, et de 2016-2017, des dernières données disponibles. Les résultats ont été vérifiés par rapport aux années intermédiaires, à intervalles de cinq ans.

La diversité était définie par la proportion d’élèves du groupe racial dominant. Les districts très diversifiés sont des endroits où moins de 75% des élèves appartiennent à la même race. Les districts diversifiés sont où 75 à 90% des étudiants appartiennent à la même race. Dans les districts peu diversifiés, sont les districts ou plus de 90% des élèves appartiennent à la même race.

Les données disponibles nous donnent, entre autres des informations sur l’année (1994-1995 ou 2016-2017), le nom de l’école, l’abréviation dans la colonne ST réfère à l’état, on a une colonne qui nous donne une des 3 valeurs discrètes pour qualifier la diversité de l’école en question (peu diversifié, diversifié, très diversifié). Si on désire pousser plus loin dans notre analyse, on a aussi à notre disposition la proportion, pour chaque école des étudiants qui sont asiatique, hispanique, noir, blanc. En fait, ce sont ces proportions qui ont servi à créer la catégorie de diversité de l’école.

Mon objectif cette semaine est de créer un visuel qui montre clairement l’évolution des différences de diversité raciales entre l’année scolaire 1994-1995 et l’année scolaire 2016-2017 pour l’ensemble des états des États-Unis. Je cherche vraiment a avoir un visuel qui présente une vision globale claire. Je n’ai pas cette semaine de contrainte d’audience ou de format de visuel. Je me laisse donc libre de créer ce qui convient le mieux pour présenter les données de la semaine.

Pour y arriver, j’ai dû trouver une façon de synthétiser les données. Je veux présenter seulement l’évolution globale des états. Donc, j’ai dû regrouper les écoles pour chaque état et identifier la catégorie de diversité qui revient le plus souvent pour 1994-1995 et pour 2016-2017. Pour pouvoir présenter tout ça dans un graphique qui est assez malléable pour le travailler de la façon que j’ai en tête, j’ai aussi converti les années et les catégories de diversité en format numérique. Ce petit truc n’a aucun autre avantage que de me donner la possibilité de travailler avec les lignes et les objets plus facilement dans mon graphique. J’ai remis les bonnes étiquettes dans la version final de la visualisation.

CHOIX DU TYPE DE VIZ: Donc, comme je l’ai mentionné mon objectif cette semaine était de créer un graphique qui montre clairement les changements de catégorie de diversité pour les états des États-Unis. Pour y arriver j’ai choisi de présenter le tout avec des pentes à deux points. Pour expliquer le contexte, l’évolution et présenter les différentes catégories de diversité, j’ai choisi d’ajouter 3 blocs de texte à la droite du graphique. Dans ma version initiale, celle qui a été présenté dans mon article de blog, je trouve qu’il y a trop de texte et que ça alourdi inutilement le visuel. En 2e partie d’épisode je vous explique comment est-ce qu’on peut balancer l’utilisation du texte pour que ce soit un outil qui travaille à notre avantage dans la présentation de nos résultats.

PRÉSENTER LE GRAPHIQUE: Le graphique que j’ai créé présente l’évolution de la diversité dans les écoles américaines. J’ai identifié les 3 catégories de diversité avec des rectangles. Les rectangles sont de la même couleur que les catégories qui ont été présenté dans l’article en lien avec les données de cette semaine. J’ai 2 séries de rectangle organisé verticalement, la première série sert à identifier les catégories pour l’année 1994-1995 et la deuxième 2016-2017. J’ai une ligne en gris foncé pour chacun des états des États-Unis. Comme les lignes seraient normalement superposées, j’ai utilisé jitter, une fonction de R qui nous permet de disposer les lignes selon un ordre aléatoire et une transparence pour donner l’effet de superposition. Comme ça, on peut facilement constater les endroits ou il y a plus de lignes ce qui signifie donc qu’il y a plus d’état dans le groupe. Le graphique montre donc visuellement l’évolution dans les nombres d’état qui compose chacune des catégories entre les deux groupes d’année. Pour mettre le tout encore plus clair, j’ai élargi le graphique vers la droite question de me faire de l’espace pour mettre du texte. Dans cet espace, je voulais expliquer les catégories de diversité et mettre en pourcentage la variation du nombre d’état dans chacune des catégories entre les années.

CONCLUSION DU GRAPHIQUE: Finalement, le pourcentage d’états américains avec des écoles extrêmement diversifiées a chuté de 20%. Le visuel que j’ai créé explique bien les catégories et l’évolution, mais ne met pas en avant plan cette conclusion clairement. C’est ce qu’on va travailler en 2e partie d’épisode.

ADD: hey! tu travailles avec R et ça t’intéresse de voir le code que j’ai utilisé pour nettoyer et visualiser mes données? Va voir dans les notes de cet épisode, j’ai mis un lien vers l’article de blog dans lequel tu pourras trouver tous les détails dont tu as besoins. Pis si jamais tu ne travailles pas dans R, va quand même voir dans les notes de cet épisode parce que j’y ai aussi inclus un petit guide qui résume les 10 règles d’or qui permettent d’améliorer les graphiques. Il te sera utile peu importe le type de données avec lesquels tu travailles ou ton objectif de présentation. Tant qu’à être rendu sur mon site, prend le temps d’aller voir l’épisode 19 au johaniefournier.com/19, c’est un épisode spécial que j’ai créé pour la journée internationale du Podcast et tu pourras y retrouver un lien pour télécharger un outil gratuit : faire passer le message. Faire passer le message, c’est en fait un petit guide qui te donne les grandes lignes à comprendre et les étapes à considérer pour créer des visuels qui vont efficacement faire passer ton message à ton audience.

REVOIR LES RÈGLES D’OR DE LA DATAVIZ: C’est vrai de dire qu’une image vaut milles mots, mais je pense qu’en visualisation de données c’est aussi vrai de dire que les mots encadrent l’image.

GRAPH1: Si on reprend mon visuel de cette semaine et qu’on retire tout texte superflu… disons tout ce que j’ai ajouté à l’exception du titre donc toutes les annotations explicatives. Je pense qu’on se retrouve avec un visuel qui à part d’avoir l’air tout nu ne peut pas s’expliquer par lui-même (il ne faut pas prendre pour acquis que les chiffres et les éléments présentés vont s’expliquer tout seul)… on se retrouve dans une situation ou on ne sait pas les 3 catégories représente quel pourcentage de diversité raciale, et comme on n’est pas en mesure de pouvoir compter le nombre de ligne de chaque catégorie à l’exception de la catégorie diversifié de 1994-1995, on peut difficilement juger de l’importance de l’évolution qu’on peut constater visuellement.

GRAPH2: Dans mon graphique original, j’ai ajouté 3 blocs de texte pour justement venir expliquer tout ça. Par contre, je pense que laisser comme ça, ça alourdi beaucoup le visuel et le lecteur se retrouve avec beaucoup de lecture à faire pour pouvoir comprendre le tout…. En général, je ne fais pas confiance à la patience du lecteur envers mes visuels, je cherche plutôt à mettre la conclusion, ou l’élément à retenir, bien en évidence pour être certaine que même ceux qui regarde mon visuel même seulement 2 sec peuvent savoir quel est l’élément important à retenir….Donc, à mon avis, ajouter tout ce texte ne permet pas de mettre en évidence la grande conclusion de mon visuel qui est que le pourcentage d’états américains avec des écoles extrêmement diversifiées à chuté de 20%.

Donc, il faut savoir comment utiliser judicieusement ce précieux outil qu’est le texte dans nos visuels. J’ai appris cette semaine que lorsqu’un lecteur regarde notre graphique, l’élément sur lequel il passe le plus de temps est le titre. Sachant ça j’ai eu envie de mettre ma conclusion directement dans le titre au détriment peut-être de la clarté de l’énonciation du sujet. J’ai aussi ajouté minimalement en sous-titre les proportions de diversités raciales qui définissent chaque des 3 catégories parce que je pense que c’est un minimum d’explication pour que le lecteur comprenne en quoi consiste les 3 catégories. Je n’ai pas rajouté les pourcentages qui définissent chacun des groupes entre les deux années. Je ne suis pas certaine que dans cette situation précise (conclusion dans le titre) la présentation de tous ces chiffres apporte un élément supplémentaire suffisamment intéressant pour justifier l’encombrement. On voit visuellement les changements, je pense que ces assez.

Donc, je pense que je me retrouve avec 2 visuels différents, un original qui est plus explicatifs et une 2e version qui est plus affirmative. Je n’arrive pas à choisir quel est ma préférée… mais je pense que dans un ordre général j’utiliserai l’une ou l’autre de ces stratégies dépendamment des circonstances ou je devrais présenter ces graphiques. Mon graphique original est plus chargé mais je le verrai bien dans une présentation ou on peut guider le lecteur à travers nos conclusions et décortiquer avec les animations de manière à faire apparaitre les éléments les uns après les autres au fur et à mesure qu’on raconte notre petite histoire. Si j’avais à présenter à un comité qui doivent prendre action suite à la présentation de mes résultats, je choisirai ma deuxième version parce que la conclusion est énoncée clairement et que même si les auditeurs repartent seulement avec la copie papier m’avoir écouté raconter ma petite histoire (sans laquelle j’inclurait verbalement les pourcentages) au mois ils auraient clairement devant les yeux l’élément à retenir. Et vous, quel est votre version préférée ? j’aimerais vous entendre, donc n’hésite pas à me contacter pour me faire part de ton opinion soit par courriel ou via les médias sociaux ou encore mieux directement dans les commentaires de l’épisode sur mon blogue,

CONCLUSION: Voilà, ça fait le tour de ce que je voulais présenter aujourd’hui. Si jamais tu as des commentaires ou des questions n’hésite pas à me contacter. Tu peux aller au johaniefournier.com/contact pour m’écrier directement ou aller dans la section commentaire de l’épisode pour poser tes questions, ça va me faire plaisir de te répondre. Alors, j’espère que cet épisode a été utile et que tu as appris quelque chose, merci de m’avoir écouté et on se dit à la semaine prochaine !

Tu as aimé le contenu de cet épisode ? il est temps d’aller écrire une évaluation sur iTunes ou sur ta plateforme préférée et de t’abonner à mon Podcast pour être avisé lors de la sortie du prochain épisode. Bonne semaine et Amuses-toi bien à visualiser tes données !

Quelques liens utiles:

Publicités

Une réflexion sur “ADV20_TRANSCRIPT – Bien utiliser le texte sur ses graphiques

  1. Pingback: ADV20 - Bien utiliser le texte sur ses graphiques | Johanie Fournier, agr.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.