Extraction et visualisation de données de la Google Search Console

La Google Search Console fournit des informations sur la visibilité de votre site sur Google. Elle associe les requêtes (=terme recherché par l'utilisateur), vos pages, le nombre de clics, le nombre "d'impressions" (= fois où votre page apparait dans le top 100) et la position moyenne. C'est un outil absolument merveilleux pour les référenceurs (SEO).

Néanmoins, lire ses données est difficile avec l'interface Google dès qu'on a un site un peu volumineux. Les exports sont limités à 1000 lignes et naviguer entre les différents filtres est pénible, avec des temps de chargement longs.

Dès qu'on a un site un peu volumineux, ces données sont très dures à lire.

Pour résoudre ce problème j'ai conçu un programme open source permettant d'extraire, classer et visualiser ces données. Il se divise en deux programmes:

Ici, je vais vous présenter le code et les difficultés rencontrées pour le développer. S'agissant du tutoriel complet, il se trouve sur mon site Unite Innovation.

Partie 1

GSC-Extractor: appel API et traitement de donnnées en python

Le GSC-Extractor (code, repo Github) est un programme python composé de deux fichiers à exécuter: weekExtractor.py, puis categorize.py.