Les fichiers sitemap et robots.txt sont-ils vraiment utiles ?

Une question débattue sur Twitter récemment nous amène à donner notre avis sur ces fichiers et leur utilité.

Afin de référencer un site Internet, deux fichiers sont régulièrement cités par les spécialistes du SEO. Qu'en est-il vraiment ?

Robots.txt : Un fichier pour les gouverner tous

Le fichier Robots.txt permet de préciser à Google quelles pages du site web il doit indexer et par extension, celle qu'il ne doit pas indexer. Les moteurs de recherche consultent donc ce fichier afin de connaître ce qu'ils peuvent ou ne peuvent pas proposer dans les résultats d'un moteur de recherche. Alors est-il vraiment utile ?

Ce qui est sûr, c'est qu'il n'est pas indispensable. Tout d'abord parce qu'il existe d'autres moyens techniques de préciser à un robot s'il doit indexer une page (une balise méta notamment). Mais au delà, la majorité des sites web ont pour objectif d'être référencés par les moteurs de recherche et par défaut, les moteurs sont de vrais gloutons en contenu. Ne pas créer de fichier robots.txt n'est donc pas un problème si votre site est correctement fait.

En revanche, si votre site expose des ressources qui n'ont aucun intérêt pour les moteurs, il faut alors ajouter un tel fichier qui précise cela. C'est particulièrement le cas pour les contenus dupliqués qui sont mal perçus par les moteurs (encore qu'il existe d'autres techniques pour que Google connaisse l'url canonique d'un contenu). C'est aussi le cas pour des fichiers de votre CMS qui sont identiques pour tous les sites faits avec ce CMS ou des fichiers de configuration ou de template qui peuvent être perçus comme du contenu de mauvaise qualité.

Notre conseil est donc d'ajouter un fichier robots.txt si vous utilisez un tel CMS, d'ailleurs certains en proposent un par défaut déjà optimisé. Sinon, si votre site est une véritable perle qualitative conçue pour n'exposer que ce qui est bon pour les moteurs, ne rien faire est la meilleure solution et aussi la plus économique.

On peut cependant ajouter un fichier robots.txt pour des raisons de performance. En effet, si les moteurs ne le trouvent pas, ils le rechercheront plus fréquemment. De plus il existe aussi des extensions pour les navigateurs qui recherchent automatiquement la présence d'un tel fichier à chaque chargement de page. L'ajouter, même vide, peut donc être bénéfique en terme de performance et d'économie de bande passante.

Nous ajoutons des fichiers robots.txt à nos sites pour ces raisons bien qu'il soit commun à tous nos sites.

A savoir : Si vous utilisez Adsense pour monétiser votre site web, vous devrez probablement ajouter à votre fichier robots.txt quelques lignes autorisant l'exploration des contenus que vous ne souhaitez pas voir indexés par les moteurs de recherche :

User-agent: Mediapartners-Google
Disallow:

Sitemap.xml : A la recherche de la page perdue

Le fichier sitemap d'un site est une sorte d'index de toutes les pages de votre site. Ce dernier permet d'exposer des pages qui n'auraient pas été découvertes par Google autrement (dixit la section Google Webmasters réservée aux sitemaps). Il permet également de préciser l'importance de vos pages à l'intérieur de votre site.

Idem, ce dernier n'est pas nécessaire si votre site est bien réalisé. C'est à dire, si le fait de parcourir votre site permet d'une part d'accéder à toutes les pages de ce dernier sans exception, d'autre part, si sa structure permet de déduire facilement l'importance de chacune des pages de votre site.

Cela est possible grâce à une arborescence bien conçue et une ergonomie facilitant une navigation fluide et un accès immédiat au cœur du site.

Nous n'ajoutons pas de fichiers sitemap ce qui serait une perte de temps sans apport réel pour le référencement dans notre cas.

Conclusion

Tout ce qui est fait pour faciliter le référencement d'un site est bon à prendre, mais encore une fois, la qualité initiale du site détermine l'effort à réaliser postérieurement pour une meilleure place dans les résultats de recherche. Notre conseil : faire un site de qualité directement.

Publié par Nicolas Froidure le Vendredi 17 Février 2012 à 12:40:54

Retour

Commentaires

Ce billet vous fait réagir ? N'hésitez pas à ajouter votre pierre à l'édifice ! Ajouter un commentaire

Derniers articles

Soumettre des bugs

Qu'il s'agisse de votre propre site ou que vous soyez simplement un de ses utilisateurs, soumettre des bugs améliore la qualité des sites web. Découvrez comment soumettre des bugs de qualité afin de permettre une résolution rapide. Suite de l'article

Sélection des commentaires

Les partisans de la liberté d'expression vont bondir, nous pensons qu'il est nécessaire de sélectionner les commentaires, voyons comment et pourquoi. Suite de l'article

Se tromper en web design

Vous l'avez peut-être remarqué, même les plus grands pondent régulièrement des maquettes de site inefficaces et ante-ergonomiques. Voici notre explication. Suite de l'article

Commentaires récents

Nous sommes d'accord, Lorem Ipsum, c'est mal ;-). J'ai la chance de ne pas faire de sous-traitance avec des entreprises que je ne connais pas. Je travaille avec un réseau de partenaires avec lesquels je suis très proche. Du coup, ... par Froidure Nicolas Suite


Je vais me permettre de te citer Nicolas, ce sera plus simple pour montrer nos points d'accord et de désaccord. Même si au fond, tu vas voir qu'on est d'accord, il y a juste un point à éclaircir (tout à la fin pour le méga suspen... par Emmanuel Suite


"empêcher le client de se concentrer sur le texte quand on lui présente une maquette" Bien au contraire ! Le texte et la maquette sont indissociables. Surtout en matière de webdesign où le contenu est l'axe central de la création. ... par Froidure Nicolas Suite

Nous contacter

SARL Elitwork
10, rue Antoine DEQUEANT
62860 Oisy le Verger
Tél. : 03 21 59 62 24
E-mail

Restons en contact

Profitez de notre veille en choississant parmi les nombreux canaux de diffusion que nous vous proposons.

Nos outils

Tremplin Numérique : Agence web spécialisée en référencement SEO à Paris et partout en France.
BBComposer : Cet éditeur permet de rédiger du contenu de haute qualité pour vos sites Internet grâce au respect de la sémantique du HTML.
CanImage : Editez facilement vos images avant de les ajouter à votre site Internet directement à l'intérieur de Firefox.