ADV27_TRANSCRIPT – Essayer quelque chose de nouveau


TEASER: Quand vient le temps de créer des visuels, on peut soit y aller pour un type de graphique connu ou bien se laisser tenter par un type de graphique qui nous est totalement inconnu…

INTRODUCTION: Ici Johanie Fournier et bienvenue à un nouvel épisode d’Agriculture, Données et Visualisation. Le podcast où je vous apporte avec moi dans le processus de traitement et de visualisation de données pour apprendre à présenter vos propres données de la manière la plus efficace possible. Sans plus tarder, voici l’épisode de cette semaine.

Bonjour et bienvenue dans ce 27e épisode. J’espère que vous allez bien! Aujourd’hui, on regarde les types de languages de programmantion qui sont présents dans les ‘Packages’ de R.

Les données de cette semaine proviennent de Phillippe Massicotte, professeur à l’Université Laval. On dispose des données prétraitées sur le site du #Tidytuesday de la semaine, mais Phillippe à aussi créer un article sur son blogue ou il nous montre sa démarche pour télécharger les 14 669 ‘packages’ et son analyse des différents langages de programmation qu’on peut y retrouver. Le lien pour avoir accès à tout ça se trouve dans mon article de blogue au johaniefournier.com/tyt2019w46.

Donc, cette semaine on dispose d’une base de données assez simple de 34 000 lignes d’information. Chacune de ces lignes nous renseigne sur le langage de programmation contenu dans un ‘Package’ en particulier en nous donnant le nombre de lignes blanches, le nombre de lignes de code et le nombre de lignes de commentaires.

Alors, après avoir regardé ces données et le blogue de Phillipe (qui fait une excellente analyse des données de la semaine en passant, ça vaut la peine d’aller y jeter un coup d’oeil) j’ai voulu rajouter une dimension à l’analyse en regardant le pourcentage de ligne de code qui ont des commentaires. Pour ceux qui ne sont pas à l’aise avec R, rapidement R c’est un logiciel d’analyse statistique qu’on utilise en écrivant des commandes qu’on appelle des lignes de codes. On bâtit donc notre programme d’analyse en succédant les lignes de codes pour que cedit programme analyse les données dans l’ordre et de la manière dont on lui a défini. Quand on commence un programme d’analyse, ça ne veut pas dire qu’on va le terminer tout de suite ou encore que ce n’est pas un collègue ou une autre personne qui va reprendre notre programme pour poursuivre ou pousse plus loin l’analyse. Donc, une bonne pratique est d’inclure des commentaires au travers de nos lignes de code pour laisser des traces de notre démarche et pour donner des indications et des explications sur les opérations effectuées. Donc un bon programme a une bonne structure d’analyse et aussi des commentaires explicatifs. La structure de R fait que les possibilités d’analyse sont infinies… on peut quasiment programmer n’importe quoi… par contre, il faut savoir comment. C’est là que les ‘Packages’ entre en jeux, en gros ce sont des fonctions déjà écrites qu’on peut importer pour se sauver du temps de programmation. Les créateurs de ces programmes les ont crées exactement de la même façon que je peux créer et structure mes propres programmes et doivent eux aussi utiliser la bonne pratique d’insérer des commentaires pour structurer leur travail. Alors, sachant ça tous les ‘packages’ n’ont pas nessairement le même nombre de ligne de code. C’est plus le ratio du nombre de lignes de commentaire sur le nombre de lignes de code qui m’intéresse. Je veux savoir quel est le pourcentage des lignes de codes qui sont expliquées par des commentaires.

CHOIX DU TYPE DE VIZ: Alors, pour présenter les résultats cette semaine, j’avais envie de tenter quelque chose de nouveau. J’ai choisi de tenter de créer un graphique radar pour présenter les résultats. C’est un type de graphique qui a ses avantages et ces inconvénients, son utilisation est même assez controversée, mais j’avais quand même envie d’essayer ce type de graphique au moins une fois pour voir les nouvelles compétences que je pouvais en retirer. C’est ce dont on va jaser en 2e partie d’épisode: les avantages d’essayer quelque chose de nouveau.

PRÉSENTER LE GRAPHIQUE: Donc, pour présenter les différents types de programmation cette semaine, j’ai choisi d’utiliser un graphique en forme de radar ou en forme de toile d’araignée c’est selon votre inspiration du moment. Dans ce type de graphique, les langages de programmation sont disposés en cercle autour du radar ou de la toile. Les lignes concentriques qui forment le radar représentent chacune une valeur de la même manière qu’on retrouve une graduation sur l’axe des x par exemple. Donc, pour chaque langage de programmation on positionne un point sur la ligne qui représente le pourcentage de lignes de codes avec commentaire qui lui est associé. En reliant chacun des points pour chacun des langages de programmation, on se retrouve avec une forme géométrique variable au centre du radar ou de la toile. Donc, pour un langage de programmation, plus le point qui le représente est loin du centre ou près du bord, plus le pourcentage de lignes de codes commentés est élevé. Rapidement, on peut voir sur ce type de graphique que les langages de programmation qui ont le plus grand pourcentage de lignes commenté sont R et Fortran 77. C’est ce que j’ai mentionné dans mon titre et j’ai utilisé le sous-titre pour préciser un peu le contexte entourant le graphique.

ADD: Hey! tu travailles avec R et ça t’intéresse de voir le code que j’ai utilisé pour nettoyer et visualiser mes données? Va voir dans les notes de cet épisode, j’ai mis un lien vers l’article de blogue dans lequel tu pourras trouver tous les détails dont tu as besoin.

REVOIR LES RÈGLES D’OR DE LA DATAVIZ: Alors, si j’avais décidé de rester dans le confort des types de graphiques que je peux faire rapidement et facilement cette semaine, j’aurais surement fait un histogramme avec des points pour indiquer les pourcentages. J’ai mis ce graphique dans les notes de cet épisode et je vous laisse le comparer avec le Radar pour juger de vous-même lequel présente les données de la manière la plus efficace possible.

Aujourd’hui j’avais envie de vous partager ma vision derrière le fait d’essayer des types de graphiques q’on n’a jamais fait.

Améliorer nos compétences, surtout si travail dans logiciel de programmation comme R toujours de nouvelles fonctions à apprendre et ces fonctions où fonctionnalités peuvent servir à améliorer d’autres aspects de notre travail. Donc même si je n’ai pas fait le plus beau graphique cette semaine, j’ai certainement découvert un nouveau ‘package’ et une nouvelle fonction. Honnêtement, les radars ne sont pas les types de graphiques que je préfère, mais je suis tout de même satisfaite d’avoir ajouté ce type à ma bibliothèque. Comme ça si jamais je dois travailler des données qui se prêtent parfaitement à ce type de graphique ou si tout simplement j’ai une demande spéciale, je saurai comment faire.

Améliorer ses compétences en programmation c’est bien, c’est même nécessaire, mais quand c’est combiné avec le fait de développer notre oeil pour le design de graphique, ça peut nous mener à créer de nouveaux types de design qui peuvent vraiment donner quelque chose de bon. Mais comment faire, me direz-vous? Ben en fait c’est assez simple, à chaque fois que je tombe sur un graphique qui contient un élément que je trouve intéressant, je l’enregistre dans ma bibliothèque de graphique. Avec le temps, je me construis une bibliothèque d’idée de graphique. Donc, quand je dois visualiser des données et que je manque d’inspiration (c’est normal, ça arrive…), je vais fouiller dans ma bibliothèque pour me donner une idée. Je vais aussi fouiller dans ma bibliothèque quand je sais quel ton je veux donner à ma visualisation, mais que je ne sais pas trop comment organiser mes idées pour y arriver. Des fois, c’est un agencement de couleur qui me fournit l’inspiration nécessaire, des fois c’est un type de graphique que je trouve serait parfait pour les données que j’ai sous la main. Dans tous les cas, je pense que ça a 2 avantages principaux. J’évite le syndrome de la page blanche et par le fait même de perdre du temps à essayer plusieurs types de graphiques avant de trouver ce que je cherche, mais ça me permet aussi de me lancer des défis de programmation. Je travaille toujours avec R. N’importe lequel logiciel peut faire l’affaire, j’ai juste plus de facilité à travailler avec R et pour moi ça apporte une belle flexibilité à mon travail. Par contre, dans ma bibliothèque de visualisation, j’ai des visuels qui ont été créés avec Tableau. Donc, le code R n’est pas disponible pour ce que je veux faire. Il faut donc que j’use de créativité pour recréer tout ça dans R. Ce qui revient à dire que c’est important pour moi de toujours développer mes compétences de programmation, parce qu’avec le temps, faire ce genre de travaille me demande de moins en moins de temps…

En terminant, le plus important c’est de s’amuser et de dépasser ses limites! Il faut pas se mettre de la pression pour toujours être parfait, fait trouver le beau et progresser dans le plaisir et l’imperfecction et un jous on se réveiller et on est capable de faire des design complexe en quelques minutes, pis ça c’est vraiment le fun…

CONCLUSION: Voilà, ça fait le tour de ce que je voulais présenter aujourd’hui. Si jamais tu as des commentaires ou des questions, n’hésite pas à me contacter. Tu peux aller au johaniefournier.com/contact pour m’écrire directement ou aller dans la section commentaire de l’épisode pour poser tes questions, ça va me faire plaisir de te répondre. Alors, j’espère que cet épisode a été utile et que tu as appris quelque chose, merci de m’avoir écouté et on se dit à la semaine prochaine!
Quelques liens utiles:

Publicités

Une réflexion sur “ADV27_TRANSCRIPT – Essayer quelque chose de nouveau

  1. Pingback: ADV27 - Essayer quelque chose de nouveau | Johanie Fournier, agr.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.