Qu'est-ce que la structure technique en référencement naturel ?

Qu’est-ce que la structure technique en référencement naturel ?

La structure technique est un élément qui peut paraître invisible mais qui est essentiel au référencement naturel. Nous l’avons vu lors d’un précédent article sur le référencement naturel que celui-ci se décompose en deux parties : la notoriété et la pertinence. La structure technique et le contenu forment à eux deux la pertinence. La structure technique pourrait être définie comme le guide des moteurs de recherche. Ceux-ci ne sont pas capable de tout interpréter, il faut donc leur expliquer, leur structurer au mieux notre contenu pour qu’ils soient en mesure d’interpréter correctement et à sa juste valeur le contenu que l’on propose.

Je m’en excuse par avance mais cet article va aborder des termes techniques que je vais m’efforcer vulgariser. Je vous invite par avance à m’exposer les zones d’ombres qui subsisteraient dans vos commentaires.

Structure technique : la validation W3C

Avant de définir la validation W3C, il est intéressant de savoir qu’est-ce que W3C. Il s’agit du sigle de l’organisme de standardisation World Wide Web Consortium. Cet organisme a pour vocation d’homogénéiser les technologies présentes sur internet. Pour que vous puissiez visualiser un site internet, beaucoup de technologies différentes peuvent être utilisées. En fonction des technologies utilisées par un site, vous devrez disposer sur votre ordinateur d’une technologie capable de la lire. Imaginez si chaque site avait une technologie particulière requérant un système différent pour chaque utilisateur, internet ne pourrait être aussi global. C’est la raison pour laquelle cet organisme créé en 1994 veille à la bonne harmonie des technologies présentes sur le web. La devise de W3C : “un seul web, partout, pour tous”.

Dans une perspective de référencement naturel, il va donc être nécessaire (et même obligatoire) de s’inscrire dans les normes édictées par W3C. Vous pouvez effectuer le test ici où vous n’aurez qu’à renseigner l’url de votre page.

Pour vous rassurer, les CMS (Content Management System ou Système de Gestion de Contenu) tels que WordPress, Drupal, Joomla, Prestashop et d’autres répondent nativement plutôt bien à la validation W3C. De manière générale, disons que ce n’est pas quelque chose dont vous aurez à vous soucier. De plus, ne paniquez pas si vous observez un certain nombre d’erreurs en faisant le test, il faut d’abord connaître leur nature pour savoir si celles-ci sont graves ou non. Vous pouvez d’ailleurs faire le test avec le site de Google, ou Facebook et beaucoup d’autres, vous verrez toujours des erreurs.

Ce qu’il faut retenir

W3C est un organisme qui veille à l’homogénéité des technologies sur internet. Si vous utilisez un CMS moderne, vous avez peu de risque de ne pas répondre à ces impératifs. Utilisez leur outil pour détecter d’éventuelles erreurs dans votre code qui pourraient amener à des dysfonctionnements.

Les balises HTML à la base du la structure technique en référencement naturel

Les balises HTML, la base de la structure technique

De quoi s’agit-il lorsque l’on parle de balises HTML ? Partons de HTML déjà, cela signifie HyperText Markup Language ou en français, langage de balisage hypertexte. De par son nom, on comprend bien que celui-ci, via le balisage, va être la structure de notre page. Ce sont l’ensemble des balises que ce dernier comporte qui vont dire aux moteurs de recherche : “voici le titre, le sous-titre, un article, un paragraphe, un tableau, etc.”.
<title>Voici une balise titre de page</title>
<h1>Une balise titre h1 de contenu</h1>
<p>Un paragraphe</p>
<table>Un tableau</table>

Les balises HTML servent donc à définir le contenu qu’elles contiennent (et pardon pour la répétition ;). Il est donc essentiel de les mettre en place correctement. L’erreur trop souvent faite est la suivante : utiliser les balises HTML pour mettre en forme le texte !

Ces pratiques sont INTERDITES quand on cherche à optimiser un contenu pour le référencement naturel. La mise en forme est à faire avec ses feuilles de style (CSS, pour Cascading Style Sheets). On ne passe pas une phrase en titre pour qu’elle soit en gras, ou en lettre capitale, on la met en forme sans toucher à ce qu’elle représente dans l’organisation du contenu.

Les balises HTML sont nombreuses et il est important de bien respecter leur structuration. Pour memo, nous avions abordé le sujet dans un article précédent dédié aux sites internet. Je vous rappelle donc qu’un navigateur web (Mozilla, Chrome, Safari, Opera…) est un logiciel qui interprète des langages web. Et seulement certains, on parle de langages “front”. Les deux plus importants (si l’on peut dire) sont le HTML pour la structure du contenu ; ce langage représente un peu la colonne vertébrale d’une page. Le deuxième est le CSS qui a pour seul objet de mettre en forme le contenu HTML. D’autres technologies “front” sont aussi utilisées, mais nous ne les aborderons pas ici.

Pour les plus avancés d’entre vous, nous détaillerons prochainement l’ensemble des balises HTML et nous verrons comment chacune doit être paramétrée.

La structure technique : les éléments périphériques

Le sitemap.xml, le répertoire guide des moteurs de recherche

Le sitemap, qui pourrait être traduit par schéma de site, est un document que l’on peut générer de son site internet. Comme l’extension l’indique c’est un document XML pour Extensible Markup Language ; il sert à lister tout ce qui a une url sur votre site internet : les images, les pages, les vidéos.

Un sitemap n’est pas obligatoire ! Pourquoi en parler alors ? L’utilité de ce document réside dans le fait qu’il va lister de manière exhaustive tous les contenus d’un site internet, même ceux qui ne sont pas directement accessibles comme les pages orphelines par exemple. Ces pages ne disposent d’aucun lien vers leur contenu, de fait un moteur de recherche ne peut pas les trouver. Un fichier sitemap les aidera. De même les pages dont vous disposez et qui ne sont pas dans la structure d’arborescence de votre site peuvent être difficiles à identifier pour les moteurs de recherche ; une fois de plus un fichier sitemap les aidera.

Ce qu’il faut retenir

Ce fichier concernera plutôt les sites assez dimensionnés voulant s’assurer que tous les contenus qui doivent être référencés le sont. Il existe beaucoup d’outils permettant de générer automatique un fichier sitemap ; ne vous amusez pas à le faire vous-même, vous perdriez alors beaucoup de temps. De plus, s’il existe, il est important de le maintenir régulièrement à jour.

Le fichier robots.txt : l’incontournable mal connu

Ce fichier robots.txt est souvent cité, mais son utilité est parfois mal comprise. Que dois-je écrire dedans, où se met-il, dois-je en avoir un, sont des questions qui reviennent souvent.

User-agent: Googlebot
Disallow: /repertoire-monsite/

L’objet de ce fichier est de communiquer aux moteurs de recherche les pages, les fichiers ou les informations qu’il ne peut pas télécharger. On peut interdire aux moteurs de recherche l’accès à des répertoires entiers et/ou à des fichiers en particulier.

Vous trouverez un intérêt à utiliser ce fichier si vous développez un site et que celui-ci n’a pas vocation à être révélé avant lancement, notamment dans le cadre d’une refonte. Sans cela se confronter à des problèmes de contenu dupliqué. Également, dans un site internet, toutes les pages ne sont pas à indexer.

Page 404 - Not found référencement naturel

La page 404 et le référencement naturel

La page 404 est une page correspondant à un message d’erreur renvoyé par le serveur au navigateur. Il existe plusieurs facteurs auxquels il faut être vigilant pour ne pas renvoyer trop de page 404.

Si un visiteur arrive sur votre page 404, le plus important est qu’il conserve tous ses repères ; cette page doit être personnalisée afin que l’internaute comprenne au moins deux choses :

  • il est sur une page d’erreur,
  • mais il peut naviguer normalement sur le site, retourner à l’accueil, accéder à l’arborescence. Il faut le rassurer.

Il est donc important de personnaliser sa page 404, même si cette action n’aura aucun impact direct sur le référencement.

Le vrai risque avec une page 404, c’est qu’il y en ai trop ce qui nuit au référencement et à l’expérience de vos internautes. Le webmaster doit donc veiller à cela régulièrement, surtout lorsqu’il utilise un CMS (et qu’il n’est pas le seul à avoir la main dessus). Pour cela Google Webmaster Tools (désormais search console) vous aidera.

Autour des URLs et du maillage

L’arborescence, une base non négligeable du référencement

Pourquoi l’arborescence est-elle si importante ? Tout d’abord c’est elle qui structure l’accès à l’information pour vos visiteurs. Elle doit donc être claire et intuitive. D’un point de vue référencement pur, celle-ci est très importante et il faut la considérer sérieusement dès la création de votre site internet.

En effet, via votre arborescence vous allez créer des catégories et sous-catégories (notamment en e-commerce) qui sont des pages de regroupement à fort potentiel de référencement. Au-delà de l’organisation logique que l’arborescence peut représenter, il convient d’étudier les mots-clés que celle-ci peut impacter.

La structure d’URL

La structure d’url découle en partie de votre arborescence. D’un point de vue référencement, on préférera plutôt les structures d’url courtes. Cependant les urls tendent à avoir un impact de plus en plus faible sur le référencement d’une page. Quelques règles de bases pour construire ses urls :

  • le séparateur de mots est le tiret “-” et non l’underscore “_”,
  • le séparateur de catégories, de rubriques ou encore de thèmes est le “/”,
  • ne pas inclure de caractères spéciaux dans vos urls : que des lettres de l’alphabet et des chiffres mais aucun accent,
  • enfin, on évitera les mots d’arrêts (de, du, le, la, à etc.) dans les urls.

Le maillage interne

Le maillage interne est très important, il permet de relier les pages de votre site entre elles et aident les moteurs de recherche à “crawler” votre site. D’une manière générale, on évitera de créer des pages orphelines sur son site internet. Celles-ci ont la particularité de n’être reliée au reste site par aucun lien. Rien ne pointe vers elle. À éviter. De ce fait, au-delà de votre menu, de vos sous-menus, n’hésitez pas au sein de vos pages et articles à mettre des liens internes lorsque c’est pertinent de le faire, c’est à dire lorsqu’il y a un réel intérêt pour le lecteur.

Pour assurer le coup auprès des moteurs de recherche, n’hésitez pas à créer une page “plan du site” qui mettra en avant l’organisation de votre site. À ne pas confondre avec le sitemap cité précédemment ! Par convention, on évite de dépasser les 100 liens par page “plan du site”. Au-delà on préfèrera en créer une deuxième.

Le fil d’Ariane

Le fil d’Ariane est une aide à la navigation. Vous le retrouvez principalement sur les sites de e-commerce. Il permet de manière très visuelle et sur toutes les pages d’identifier à quel niveau de l’arborescence nous nous trouvons. En plus de l’internaute, celui-ci est utile aux moteurs de recherche en les aidant dans leur navigation.

Sur un petit site, il n’est pas indispensable, mais quoi qu’il en soit, sachez que le fil d’Ariane ne sera jamais considéré comme un problème ou un inconvénient.

Pour conclure sur la structure technique

La structure technique est très importante pour le référencement naturel. Il ne faut pas la négliger et même, il est très important de se pencher sur le sujet avant d’entamer tout projet web. En effet, corriger la structure technique d’un site déjà créé peut être compliqué, donc soit vous coûter cher, soit vous prendre beaucoup de temps.

Pensez-y et étudiez bien les problématiques qui en découlent avant de choisir votre solution web. Les bons choix que vous ferez tout de suite, vous feront gagner du temps par la suite. Si vous êtes en projet actuellement et que vous hésitez sur la technologie à utiliser, n’hésitez pas à m’en faire part dans les commentaires, je vous répondrai avec plaisir.

Share This