C’est quoi un « sitemap »?
Les sitemaps sont importants pour vos sites et vos moteurs de recherche. Pour les moteurs de recherche, les plans de site sont un moyen simple et direct d’obtenir des informations sur la structure et les pages de votre site Web. Les sitemaps XML fournissent également des métadonnées cruciales, telles que: À quelle fréquence chaque page est mise à jour. Quand ils ont été modifiés pour la dernière fois. L’importance des pages les unes par rapport aux autres. Cependant, il existe certaines bonnes pratiques pour utiliser un plan de site à votre avantage maximum.
Prêt à apprendre à optimiser les sitemaps XML? Vous trouverez ci-dessous 13 bonnes pratiques pour obtenir le meilleur rapport qualité-prix en matière de référencement. 1. Utilisez les outils et plugins pour générer automatiquement votre plan de site La création d’un plan de site est facile lorsque vous disposez des bons outils, tels qu’un logiciel d’audit avec un générateur de plan de site XML intégré ou des plugins populaires tels que Google XML Sitemaps En fait, les sites Web WordPress qui utilisent déjà Yoast SEO peuvent activer les Sitemaps XML directement dans le plugin Vous pouvez également créer manuellement un plan de site en suivant la structure du code de plan de site XML. Techniquement, votre plan de site n’a même pas besoin d’être au format XML – un fichier texte avec une nouvelle ligne séparant chaque URL suffira. Cependant, vous devrez générer un plan de site XML complet si vous souhaitez implémenter l’attribut hreflang, il est donc beaucoup plus facile de laisser un outil faire le travail à votre place. Visitez les pages officielles de Google et Bing pour plus d’informations sur la configuration manuelle de votre plan de site.
2. Envoyez votre sitemap à Google Vous pouvez soumettre votre plan de site à Google à partir de votre Google Search Console Dans votre tableau de bord, cliquez sur Explorer> Sitemaps> Ajouter un sitemap de test. Testez votre plan de site et affichez les résultats avant de cliquer sur Soumettre le plan du site pour rechercher les erreurs susceptibles d’empêcher l’indexation des principales pages de destination. Idéalement, vous voulez que le nombre de pages indexées soit le même que le nombre de pages soumises. Notez que la soumission de votre plan de site indique à Google quelles pages vous considérez comme étant de haute qualité et dignes d’être indexées, mais cela ne garantit pas qu’elles seront indexées. Au lieu de cela, l’avantage de soumettre votre plan de site est de: Aidez Google à comprendre la présentation de votre site Web. Découvrez les erreurs que vous pouvez corriger pour vous assurer que vos pages sont correctement indexées. 3. Donner la priorité aux pages de haute qualité dans votre plan de site En ce qui concerne le classement, la qualité globale du site est un facteur clé. Si votre plan de site dirige les robots vers des milliers de pages de mauvaise qualité, les moteurs de recherche interprètent ces pages comme un signe que votre site Web n’est probablement pas celui que les gens voudront visiter – même si les pages sont nécessaires pour votre site, telles que les pages de connexion. Essayez plutôt de diriger les robots vers les pages les plus importantes de votre site. Idéalement, Agence web E Sport ces pages sont: Engagement rapide des utilisateurs via des commentaires et des critiques. 4. Isoler les problèmes d’indexation Google Search Console peut être un peu frustrant s’il n’indexe pas toutes vos pages, car il ne vous dit pas quelles pages posent problème. Par exemple, si vous soumettez 20 000 pages et que seulement 15 000 d’entre elles sont indexées, vous ne saurez pas quels sont les 5 000 pages problématiques ». Cela est particulièrement vrai pour les grands sites de commerce électronique qui ont plusieurs pages pour des produits très similaires. Le consultant SEO Michael Cottam a rédigé un guide utile pour isoler les pages problématiques. Il recommande de diviser les pages de produits en différents sitemaps XML et de tester chacun d’eux. Créez des sitemaps qui confirmeront les hypothèses, telles que les pages qui n’ont pas d’images de produits ne sont pas indexées « ou les pages sans copie unique ne sont pas indexées. »
Une fois que vous avez isolé les principaux problèmes, vous pouvez soit travailler pour résoudre les problèmes, soit définir ces pages sur noindex », afin qu’elles ne diminuent pas la qualité globale de votre site. En 2018, Google Search Console a été mis à jour en termes de couverture d’index En particulier, les pages problématiques sont désormais répertoriées et les raisons pour lesquelles Google n’indexe pas certaines URL sont fournies. 5. N’incluez que les versions canoniques des URL dans votre plan de site Lorsque vous avez plusieurs pages très similaires, telles que des pages de produits pour différentes couleurs du même produit, vous devez utiliser la balise link rel = canonical « pour indiquer à Google quelle page est la » page principale « qu’il doit explorer et indexer. Les robots ont plus de facilité à découvrir les pages clés si vous n’incluez pas de pages avec des URL canoniques pointant vers d’autres pages. 6. Utilisez la balise Meta pour les robots chaque fois que cela est possible Lorsque vous ne souhaitez pas qu’une page soit indexée, vous souhaitez généralement utiliser la balise meta robots noindex, follow « .
Cela empêche Google d’indexer la page, mais cela préserve la valeur de vos liens, et c’est particulièrement utile pour les pages utilitaires qui sont importantes pour votre site mais qui ne devraient pas apparaître dans les résultats de recherche. Le seul moment que vous souhaitez utiliser pour bloquer des pages, c’est lorsque vous consommez votre budget d’exploration Si vous remarquez que Google réexamine et indexe des pages relativement peu importantes (par exemple, des pages de produits individuelles) au détriment des pages principales, vous pouvez utiliser 7. Créer des sitemaps XML dynamiques pour les grands sites Il est presque impossible de suivre tous vos méta-robots sur d’énormes sites Web. Au lieu de cela, vous devez définir des règles pour déterminer quand une page sera incluse dans votre sitemap XML et / ou modifiée de noindex à index, suivez. » Vous pouvez trouver des instructions détaillées sur la manière exacte de créer un plan de site XML dynamique mais, encore une fois, cette étape est beaucoup plus facile à l’aide d’un outil qui génère des plans de site dynamiques pour vous. 8. Utilisez des sitemaps XML et des flux RSS / Atom Les flux RSS / Atom informent les moteurs de recherche lorsque vous mettez à jour une page ou ajoutez du nouveau contenu à votre site Web. Google recommande d’utiliser à la fois des plans de site et des flux RSS / Atom pour aider les moteurs de recherche à comprendre quelles pages doivent être indexées et mises à jour. En n’incluant que du contenu récemment mis à jour dans vos flux RSS / Atom, vous faciliterez la recherche de nouveaux contenus pour les moteurs de recherche et les visiteurs. 9. Mettre à jour les heures de modification uniquement lorsque vous apportez des modifications substantielles N’essayez pas de tromper les moteurs de recherche pour qu’ils réindexent les pages en mettant à jour votre heure de modification sans apporter de modifications substantielles à votre page. Dans le passé, j’ai longuement parlé des dangers potentiels d’un référencement risqué Je ne répéterai pas tous mes points ici, mais il suffit de dire que Google peut commencer à supprimer vos horodatages s’ils sont constamment mis à jour sans fournir de nouvelle valeur. 10. N’incluez pas les URL « noindex » dans votre sitemap En parlant de budget d’exploration gaspillé, si les robots des moteurs de recherche ne sont pas autorisés à indexer certaines pages, alors ils n’ont aucune activité dans votre plan de site.
Lorsque vous soumettez un plan de site contenant des « pages bloquées et » noindex « , vous dites simultanément à Google qu’il est vraiment important d’indexer cette page » et que vous n’êtes pas autorisé à indexer cette page. » Le manque de cohérence est une erreur courante. 11. Ne vous inquiétez pas trop des paramètres de priorité Certains plans Sitemap ont une colonne « Priorité » qui indique ostensiblement aux moteurs de recherche quelles pages sont les plus importantes. Cependant, la question de savoir si cette fonctionnalité fonctionne réellement a longtemps été débattue. En 2017, Gary Illyes de Google a tweeté que Googlebot ignorait les paramètres de priorité lors de l’exploration. 12. Ne laissez pas votre plan de site devenir trop volumineux Plus votre plan de site est petit, moins vous mettez de pression sur votre serveur. Google et Bing ont tous deux augmenté la taille des fichiers de plan de site acceptés de 10 Mo à 50 Mo et 50 000 URL par plan de site. Bien que cela soit plus que suffisant pour la plupart des sites, certains webmasters devront diviser leurs pages en deux plans de site ou plus. Par exemple, si vous exploitez une boutique en ligne de 200 000 pages, vous devrez créer cinq plans de site distincts pour gérer tout cela. Voici les conseils de John Mueller de Google sur la façon d’ajouter des plans de site pour plus de 50 000 URL. TLDR: créez un fichier de plan de site pour les plans de site. 13. Ne créez pas de plan de site si vous n’êtes pas obligé de le faire N’oubliez pas que tous les sites Web n’ont pas besoin d’un plan du site. Google peut trouver et indexer vos pages de manière assez précise. Selon Mueller, le plan du site lui-même n’apporte pas la même valeur de référencement à tout le monde. Fondamentalement, si votre site Web est un portfolio / une page, ou s’il s’agit d’un site Web d’organisation que vous mettez rarement à jour, le plan du site n’est pas vraiment nécessaire. Cependant, si vous publiez beaucoup de nouveau contenu et que vous souhaitez qu’il soit indexé le plus rapidement possible, ou si vous avez des centaines de milliers de pages (exécutant un site Web de commerce électronique, par exemple), un plan de site est toujours un excellent moyen de donner des informations directement. à Google