Pendant la période festive du Nouvel An, JohnMu, expert chez Google, a délivré un avertissement crucial à un webmaster dans un fil de discussion au sein de la communauté d’aide aux webmasters de Google. Son message visait à éclairer les praticiens du référencement sur l’importance de ne jamais inclure d’identifiants de session dans le fichier Sitemap XML.
Dans ses propos, John a souligné :
Si vous ne soumettez pas d’URL propres dans votre fichier Sitemap, il est préférable de ne pas utiliser de fichier Sitemap. La présence d’identifiants de session causera plus de problèmes (lors de l’exploration et de l’indexation de ces URL) que si vous nous laissez explorer votre site web normalement (surtout si vous avez une structure d’URL propre). Je vous conseille donc de supprimer le fichier Sitemap ou de vous assurer que les URL soumises sont exactement les mêmes que celles que nous avons trouvées lors du crawl.
Imaginez un instant offrir à Google des doublons d’URL pour la même page d’atterrissage. C’est comme lui servir sur un plateau d’argent du contenu en double. Et pourtant, c’est exactement ce que vous faites lorsque vous incluez ces URL dans un fichier Sitemap.
Si vous avez des contenus répétés sur votre site sans les bloquer, Google a de grandes chances de les découvrir lorsqu’il explore votre site, bien plus que s’ils étaient simplement répertoriés dans un fichier Sitemap.
C’est pourquoi il est crucial de ne jamais inclure d’URL en double ou basées sur des identifiants de session dans votre fichier Sitemap. En évitant cette erreur, vous évitez bien des ennuis et vous garantissez à votre site une meilleure visibilité aux yeux de Google.