Se débarrasser des erreurs 404

Les erreurs 404 sont une plaie en SEO, on le sait. Pour les corriger, j'ai tendance à les classer en trois catégories distinctes : les erreurs 404 internes, externes et les 404 en provenance d'autres sites. Si les deux premières sont assez simples à corriger, les erreurs 404 provenants d'autres sites sont un peu plus complexes.

Les 404 internes et externes

Ce sont des liens placés sur votre site, pointant vers une autre page de votre site (internes) ou vers un autre site (externes) et qui pointent vers une page qui n'existe plus. Pour les repérer, prenez votre logiciel de crawl préféré (Xenu, Integrity, Screaming Frog, etc.) et faites une analyse de votre site. Une fois l'analyse terminée, exportez le fichier au format CSV, ouvrez-le avec Excel et filtrez de façon à ce que seulement les liens avec un code de réponse 404 soient affichés.

Si des pages internes sont en 404, il vous suffit d'aller sur la page où le lien est présent et de modifier ce lien pour qu'il pointe vers une page existante. Plutôt simple non ? Si ce sont des pages d'un autre site qui renvoient cette erreur, soit vous prenez le temps d'effectuer la même opération, soit vous supprimez purement et simplement le lien.

Les erreurs en provenance d'autres sites

Celles-ci sont un peu plus délicates à gérer. Tout d'abord pour les repérer, rendez-vous dans Google Webmaster Tools ==> État de santé ==> Erreurs d'exploration ==> Introuvables. Google vous liste les pages de votre site qu'il ne trouve pas (à cause d'une faute dans l'URL par exemple) et vous indique leur provenance.

Pour les corriger, deux solutions existent. Si le site liant est un site dont vous connaissez le webmaster, le plus simple est de le contacter pour lui demander de corriger son erreur. Deuxième cas de figure : il peut s'agir d'un site que vous ne connaissez pas, dans une langue que vous ne connaissez pas, où vous pensez qu'il sera impossible de modifier l'URL ou alors tout simplement si vous n'avez pas le temps de le contacter. Dans ce cas vous pouvez poser une rustine en effectuant une redirection 301 depuis l'URL erronée vers une page de votre choix, via le fichier .htaccess.

Article en relation :
Les redirections 301 et 302

Catégorie Astuces référencement | Thématique .

22 réponses à Se débarrasser des erreurs 404

  1. C’est le genre de chose que les débutants ne savent pas forcément.
    C’est le genre de chose que les connaisseurs savent, mais ne regarde pas à forcément ^^

    Pour le 1er cas de figure, même si on ne connait pas le webmaster, on lui demande quand même de modifier. C’est tout benef pour lui de le modifier. Proposer une erreur 404 à ses lecteurs c’est moyen.

  2. Guillaume says:

    Salut Sylvain,
    Haaa ces pages en erreur… Je t’avoue m’être arracher les cheveux sur la correction de milliers de 404 (merci google webmaster tool) qu’un site me générait si gentiment.
    Je crois que j’ai pris la décision de laisser courir a la fin….
    Merci pour cet article, ça fait plaisir de voir qu’on a tous les mêmes soucis….

  3. Daniel Roch says:

    Pour se débarrasser des 404, certains CMS permettent de les détecter de manière automatique : par exemple les plugins « 404 notifier » ou « Broken Link Checker » pour le CMS WordPress. Ils détectent les liens cassés et les 404 provoquées par des liens internes ou externes.

    Et ensuite, il existe aussi sur certains CMS des outils qui permettent d’éviter l’erreur en faisant une redirection automatisée vers l’URL la plus proche (comme un %like en SQL).

  4. Damoiselles says:

    Bonne astuce le htaccess, j’utilise parfois une autre technique qui consiste à créer la page avec l’URL comportant la coquille, sur laquelle je place un texte explicatif « vous venez du site xyz.com mais le lien comportait une erreur, je vous invite donc à vous rendre sur la page correspondante jhjhjh.html »

    Cela demande un tout petit plus de temps, mais permet de tracer le nombre de visites générées par le mauvais lien !

    Et ne pas oublier de personnaliser la 404 avec un plan du site par exemple.

  5. Eric says:

    Merci Sylvain pour ce petit tuto rapide et efficace ! En plus je comptais faire un petit test aujourd’hui dans l’aprem avec ta technique sous Mac. J’utilise Integrity => Export CSV => Import Liste dans Screaming Frog

    Je sais que cela te rappelle quelque chose ;)

    Bonne journée.

  6. Lionel says:

    Pour ceux utilisant wordpress il y a le plugin Redirection que je trouve assez bien fait. Plus simple que le .htaccess pour la plupart des gens

  7. Cédric says:

    Merci pour ce petit rappel. Tu cites dans ton articles trois applications pour détecter les 404. Lequel te paraît le meilleur, disons pour un WordPress de quelques centaines de pages max ?

  8. Flo says:

    Aie les erreurs 404, la plaie pour un référenceur ! Surtout lorsque l’on pense avoir éradiqué le problème est que l’on retourne dans son GWT et que de nouvelles sont arrivés ! C’est un véritable travail de suivi qu’il faut mener…

    A ce propos, j’ai une question : lors d’une refonte d’un gros site e-commerce, comment s’en prémunir ? Réaliser un lot de 10000 redirections en masse n’est ce pas un problème ?

  9. Fred says:

    Hello Sylvain,

    Cela fait partie de ma procédure de création de plan de redirection.
    Les liens qui proviennent d’autres sites et qui pointent vers une page inexistantes sont des backlinks gratos ;) C’est un aspect à ne surtout pas négliger lorsqu’on récupère un site provenant d’une autre agence.
    Lors de la refonte d’un site web, Google lui même peut être le site externe qui renvoi vers une page devenue inexistante.
    Pour éviter un maximum de ces erreurs je procède en 3 étapes :
    1. Tester les http status code de chaque page indexée dans Google en les récupérant via la commande site:monsite.tld
    2. Utiliser les GWT
    3. Utiliser un outil comme ahrefs.com qui va nous donner les backlinks qui pointent vers une 404

    Après pour gérer cela en live on peut automatiser cela en programmant un petit script sur la 404 elle même et récupérer le referer.

  10. Blitz says:

    Un petit pari entre vous et moi….

    Je vous parie que Google considèrera le fait d’avoir un tout petit pourcentage de 404 dans ses liens comme une preuve de « naturel »…

    Après avoir cartographier les habitudes d’un internautes pour émettre un jugement crédible….il va maintenant continuer à nous pondre des critères à la c…et cela risque de durer ;)

  11. Le Juge says:

    Tiens un article completement d’actualité – parce que la je galere justement sur un projet ou els mecs on migré leurs sites et leurs blogs pleins de liens internes et de liens croisés et autant les pages du site ca va – aps de soucis – 301impec, idem pour le gros du blog mais il me reste des 404 notamment une qui tourne en boucle (la saleté) et je la trouve pas au milieu de la masse ds posts et des liens

    @Daniel

    Merci pour le plugin – va m’etre utile celui la!

  12. Guillaume says:

    Il y a aussi des erreurs 404 internes un peu embêtantes. Je me suis retrouvé avec une 404 car Google lisait un bout de code JavaScript contenant une URL sauf que cette URL n’était pas complète, du coup GWT m’indiquait une 404, du coup j’ai fait une 301.

    Mais pour ce qui est des 404 externes la plupart du temps je laissé comme ça car je ne savais pas vraiment quoi faire.

  13. Sylvain says:

    La galère, c’est quand tu te récupère 2500 erreurs 404 d’un coup qui proviennent d’un site à la noix (outils d’analyse seo pourri qui te fait des liens…).
    Parce que ça commence à faire beaucoup en redirections dans un htaccess.

    Vécu hier, je n’ai pas encore de solution.

  14. Sylvain says:

    @Flo @Sylvain : Comme le dit Daniel, une redirection automatisée vers l’URL la plus proche ne ferait pas l’affaire ? Il me semble que dans le .htaccess, ça peut se gérer avec une RewritCond %{REQUEST_FILENAME} !-f suivie d’une rewriterule (sans conviction cependant). Si les fausses URL causées par le site d’analyse (je connais ça aussi, mais pas en nombre industriel) suivent le même modèle, il y a peut-être moyen de personnaliser les redirections des mauvaises URL (via des regex) ?

  15. Sylvain says:

    Oui, c’est une piste que l’on regarde pour éviter cela.
    Il faut juste trouver une condition partagée par toutes les URL, ne pas risquer de la trouver sur les URL valides, et rediriger vers la home (pas le choix car ça le fait avec toutes les url du site).

    Merci les ptits loups :-)

    Et je ne donne pas l’adresse du site pourri qui fait ça car c’est un bon moyen de faire du NSEO :-)

  16. Numastick says:

    Hello,
    Et ben moi j’ai récemment galéré avec une URL où j’avais une parenthèse fermante à tort – genre « http//www.monurl.fr) » – depuis un site externe à 2 balles.
    Impossible de la rediriger via une 301… je crois que j’ai tout essayé : au mieux il ne se passait rien, au pire je faisais tomber le site (très classe !).
    Bref, pas dramatique mais super agaçant !
    Du coup, j’ai laissé tomber, les 404 c’est vraiment la plaie parfois…
    PS : si quelqu’un a une super idée pour ce genre de truc, je prends, hein…

  17. jude says:

    Merci pour ce petit tuto et j’ai rebondi sur l’article sur Screaming Frog for free :)
    Mes ex 404 te disent merci !!

  18. Géraldine says:

    Merci pour ces conseils… qui m’ont mis la puce à l’oreille et m’ont incitée à me tourner vers ma grenouille préférée (Sceaming…) Bilan : pas de 404… pour ce coup-ci ! mais effectivement, avec WordPress, on est relativement à l’abri. Sinon, je prendrais bien des conseils pour les autres codes, type 301 et ses copains ;-) … Bonne journée !

  19. Germain says:

    Merci pour tes conseils Sylvain. 2013 sera vraiment l’année penché sur la « technique » : éviter au max les erreurs de crawl, soigner le contenu dupliqué, améliorer le maillage entre les pages, désindexer les pages inutiles d’un site.
    L’analyse de logs va dans ce sens.

  20. Youri says:

    perso, j’opte pour une bonne 301 mais c’est pas toujours évident à gérer quand on a des milliers de 404.

    Dans le pire des cas, on peut scanner les mots clés de l’url et faire une recherche sur base des ces mot-clés pour proposer un article pertinent.

  21. GeekPress says:

    Pour les erreurs 404, je me permets de vous parler vite fait de mon dernier plugin Auto Redirect 404 in 301 for Trashed Posts.

    Derrière ce nom barbare se cache un plugin assez pratique. En effet, il fait une redirection 301 dès qu’un article publié passe en corbeille ou dans un autre statut.

    A l’aide des paramètres du plugin, vous pouvez choisir l’adresse de redirection de chaque article/page/catégorie/tag que vous allez supprimer.

    http://wordpress.org/extend/plugins/auto-redirect-404/

    Une chose de plus pour lutter contre les 404 :)

  22. simon says:

    bonjour je suis emmerdé avec une erreur 404 qui s affiche des que je sort d un site et que je revient sur la page Google ou il y a le resulta des recherches merci de m aider
    The requested URL /-9741*sfxd*f1f9c978-ae61-2fea-8c79-470125c2b97d-b94*sfxd*main_allenby.js%
    voila l erreur

Veuillez utiliser votre nom ou votre pseudo. Tout commentaire ne respectant pas cette règle verra son lien supprimé.