Une Question ? +33 (0)6 86 58 97 18

Étude de cas SEO : optimisation d’un maillage interne

Aujourd’hui j’aimerais partager avec vous un travail d’optimisation que j’ai effectué sur le maillage interne d’un site. Pour l’exemple, le blog étudié est de taille moyenne et la thématique importe peu. Cependant, sa composition « multi-thématisée » est intéressante (les thématiques n’ayant pas de lien logique entre-elles) et soulève un challenge SEO intéressant : celui d’arriver à isoler suffisamment les contenus de chaque thématique pour ne pas que la structure du site soit perçue par Google comme un vaste Gloubi-boulga. Le but n’est pas ici de vous expliquer en détail comment générer le rendu 2D d’une structure mais de vous montrer comment vous pouvez agir sur votre maillage interne à partir d’une visualisation graphique pour améliorer la compréhension de votre site par les moteurs de recherche. Ready ? Go !

Configuration du site étudié

Voici la configuration du blog en question :

  • environ 200 URL au total
  • 2 sous-ensembles thématiques que nous appellerons pour simplifier la thématique R (pour Rouge) et la thématique B (pour Bleue)
  • R et B apparaissent sur le site sous la forme de catégories (nous appellerons les catégories mères R1 et B1 puis leurs filles respectives R1-1, R1-2, R1-3 et B1-1, B1-2)
  • la majorité des URL correspondent à des articles rangés excusivement dans une catégorie : soit R1-n soit B1-n
  • aucun article n’est rangé à la fois dans une catégorie R1-n ET dans une catégorie B1-n
  • chaque article est enfant direct d’une catégorie R1-n ou B1-n ; ce qui signifie qu’aucun article n’est rattaché directement à une catégorie mère (R1 ou B1)

Voici un schéma qui résume l’arborescence des contenus (la navigation offerte au visiteur du site par le menu principal) :

Arborescence initiale site

Crawl initial du site et génération d’un rendu 2D du maillage interne

A ce stade, j’utilise en général conjointement Xenu et Screaming Frog pour extraire la liste des URL et des liens sortants depuis chaque URL crawlée. Après export et retraitement des fichiers, on obtient une liste de noeuds et de liens exploitables pour nourrir son outil de visualisation préféré. Pour ma part, j’utilise Gephi, un outil bien pratique pour générer ce type de graphes. Après import des feuilles de calculs Excel et configuration du rendu 2D (paramétrage de la taille des noeuds, ajout des couleurs pour rendre plus sexy l’ensemble), on obtient un premier graphe permettant d’apprécier la répartition du jus de lien interne (plus un noeud est lié par d’autres noeuds, plus il apparaît avec une taille importante) :

Maillage interne Gephi visualisation 1

Voici quelques enseignements que l’on peut tirer :

  • en gris foncé, le noeud central correspond à la page d’accueil du site : sans surprise, c’est le noeud le plus imposant.
  • en rouge foncé et bleu foncé respectivement, les catégories mères R1 et B1 sont proches de l’accueil et leurs catégories filles sont relativement proches d’elles; ce qui semble logique.
  • situées à un même niveau dans l’arborescence (égale distance hiérarchique de B1), les catégories filles B1-1 et B1-2 n’apparaissent pas sur le graphe dans la disposition attendue : si je n’avais pas coloré les noeuds, il aurait été quasiment impossible de les distinguer de B1. Même remarque du côté des catégories R1, R1-1, R1-2 et R1-3. Phénomène également étonnant pour la thématique R, R1 paraît plus éloignée de l’accueil que certaines de ses filles… Nous allons devoir clarifier tout ça : ce sera notre premier axe d’optimisation.
  • les articles (points noirs sur le graphe) sont disposés dans l’espace du « côté » de leur thématique : on constate que les articles de la thématique R sont plus nombreux que ceux de la thématique B, ce qui reflète bien la réalité. Cependant, nombreux sont les liens reliant un article de la thématique B à un article de la thématique R (et inversement). Nous allons devoir également travailler sur ce point pour supprimer les liens directs entre articles et catégories de thématiques différentes. Ce sera notre deuxième axe d’optimisation.
  • autour de la page d’accueil, deux noeuds gris clair ressortent fortement : il s’agit de la page « A Propos » (ce qui est logique puisqu’elle est présente sur toutes les pages du site) et de la page d’accès aux « Conditions Générales d’Utilisation » du site (présente aussi sur 100% des pages en footer et découverte par hasard à ce stade de l’étude : je l’avais oubliée celle-la !) Cette page des CGU représente un « poids » presque aussi important que celui des pages catégories : nous allons y remédier en cachant le lien qui restera accessible grâce à un petit script JS mais ne sera plus accédé lors du crawl (une technique parmi d’autres). Ce sera notre troisième axe d’optimisation.

Mise en place des corrections au niveau de la navigation principale

Grâce à la visualisation du maillage interne et après avoir évalué les possibilités de configuration du CMS sur lequel le site tourne (les mises à jour du maillage interne nécessitent parfois un peu de développement), commençons par optimiser la navigation principale.

Le menu principal du site qui génère le plus de liens est identique sur toutes les pages, ce qui signifie que chaque catégorie ou article rangé dans l’une des deux thématiques génère des liens sortants vers les deux thématiques. Afin d’isoler davantage ces ensembles thématiques l’un de l’autre, pour les rendre plus efficaces, nous allons devoir changer la mécanique pour faire en sorte que si l’on se trouve sur la thématique R, la navigation ne permette plus d’accéder directement aux catégories filles de B1 (il faudra d’abord se rendre sur B1 pour accéder aux catégories B1-1 et B1-2). De la même façon, sur un contenu de la thématique B on ne doit plus pouvoir accéder directement aux catégories filles de R1. On va donc faire en sorte que les pages non thématisées présentent toujours la même version exhaustive du menu. En revanche, si l’on se trouve sur une catégorie ou un article appartenant à une thématique, nous n’aurons accès qu’à une vue partielle du menu (exhaustive pour les catégories de la thématique sur laquelle nous sommes, restreinte à la catégorie mère pour l’autre thématique).

En résumé, voici les différentes vues du menu que l’on veut mettre en place suivant l’endroit où l’on se trouve :

  • Sur les pages situées en dehors des thématiques (exemples : page d’accueil, page « A propos »…) :

Arborescence initiale site

  • Sur les pages appartenant à la thématique B (catégorie ou article) :

Arborescence site vue thématique B

  • Sur les pages appartenant à la thématique R (catégorie ou article) :

Arborescence site vue thématique R

Une fois les optimisations déployées sur le site, on peut générer un nouveau rendu 2D du maillage :

Voilà qui est mieux ! Désormais on voit bien ressortir les catégories mères à équidistance de la page d’accueil. Leurs filles sont bien distinctes d’elles : la logique hiérarchique entre les catégories est beaucoup plus claire.

Mise en place des corrections au niveau des « side links » entre thématiques

Bien que la structure du maillage ait été améliorée, il reste encore un peu de travail notamment au niveau des liens entre les articles : les side links. Je les appelle ainsi puisqu’il s’agit de liens secondaires, apportés par chaque contenu catégorisé via une zone de type « voir les articles complémentaires », « les top articles du moment », « articles les plus populaires », etc. Ces liens ne sont pas fondamentalement à proscrire (au contraire ils peuvent enrichir votre maillage et l’expérience utilisateur) mais dans le cas du blog étudié, ils pointaient souvent vers des catégories situées dans l’autre thématique que celle du contenu accédé : par exemple les articles rangés dans R1-2 produisaient des side links vers B1-1… La conséquence de tout ça : un maillage confus qui ne permettait pas aux thématiques d’être suffisamment « étanches ».

Un axe d’optimisation intelligent ne consiste pas ici à supprimer les side links (ce qui fonctionnerait d’un point de vue purement SEO mais priverait le visiteur d’un contenu associé) mais à produire uniquement des side links en restant à l’intérieur de la même thématique. Après application de la mise à jour, voici le graphe obtenu :

 

Maillage interne Gephi visualisation 3

Là on se dit qu’on est plutôt pas mal : les articles dont on avait du mal à percevoir le rattachement direct, se pressent désormais davantage autour de leur catégorie. On obtient une répartition dans l’espace en « grappes » de contenus bien plus aérée. C’est le Googlebot qui va être content !

Masquage des liens annexes

Le plus gros du travail est accompli. Pour peaufiner, je vous propose de faire disparaître (magie !) les liens annexes. Il s’agit de liens (réassurance ou mentions légales) généralement présents sur 100% des pages d’un site dans la zone du footer. Ici, dans mon exemple, je n’ai qu’un seul lien dans ce cas : les CGU que vous pouvez voir sur le graphe précédent ressortir en gris clair, juste en dessous du noeud représentant l’accueil (l’autre noeud de la même couleur correspond à la page « A Propos » que nous souhaitons conserver). Au passage, vous remarquez aussi l’influence qu’a ce noeud CGU sur les articles : dans le prolongement du lien « accueil-CGU », une petite « grappe » lui semble visuellement rattachée or ce noeud CGU n’est pas une catégorie… En le masquant du crawl, nous allons ainsi améliorer la compréhension du rattachement des articles à leur catégorie.

Sans rentrer dans les détails techniques (ce n’est pas l’objet de l’article), je me sers d’un petit script pour rendre le lien invisible (en le laissant cliquable pour les internautes). Nous voici donc avec un nouveau graphe dans lequel le noeud des CGU a disparu (et les articles ont été correctement redistribués dans l’espace) :

Maillage interne Gephi visualisation 4

 

Exercice bonus : ajout d’une landing page pour regrouper les contenus de plusieurs catégories d’une même thématique

Avant de conclure ce cas pratique sur l’optimisation du maillage interne, je vous propose d’enrichir le contenu de la thématique R. Mettons que l’on souhaite regrouper au sein d’une nouvelle page plusieurs articles rangés dans R1-1, R1-2 et R1-3 sans changer la catégorisation ni perturber la structure existante. Une solution consiste à construire une landing page qui sera accessible directement via le menu principal, uniquement sur les vues des contenus situés hors thématique et dans la thématique R. Ce qui donne :

  • Sur les pages situées en dehors des thématiques (exemples : page d’accueil, page « A propos »…) :

Arborescence site - landing page dans thématique R

  • Sur les pages appartenant à la thématique R (catégorie ou article) :

Arborescence site - landing page dans thématique R - vue partielle

Notez que la vue du menu principal sur les pages appartenant à la thématique B ne change pas (ni les catégories filles de R1, ni la landing page ne sont accessibles).

On obtient un nouveau maillage interne avec notre landing page (représentée en vert) au centre des catégories dont elle présente les contenus :

Conclusion de l’étude

Je m’arrête ici pour ce cas pratique qui vous aura été, je l’espère, utile pour comprendre l’analyse que l’on peut faire à partir d’une visualisation de son maillage interne, les optimisations que l’on peut facilement mettre en place et leur influence sur la structure interne d’un site. Cerise sur le gâteau, vous savez à présent comment ajouter de nouvelles pages pour faire croître votre maillage interne sans en perturber la compréhension. N’hésitez pas à réagir en commentaire si vous avez des questions !

Partager :

Laisser un commentaire