Désindexer une URL de Google

Il arrive parfois que l'on souhaite qu'une de nos pages n'apparaisse pas sur Google. Étant donné qu'on peut lire tout et son contraire, je vais vous expliquer ici une méthode qui fonctionne, test à l'appui. Ce n'est pas la seule mais c'est certainement la plus simple à mettre en place.

Comment supprimer une page de Google ?

Lorsqu'on pose cette question, on se retrouve souvent avec pour réponse "facile, il suffit d'en interdire le crawl dans le robots.txt" Faux et archi faux ! Ce serait même contre-productif. Google est bête et méchant (ne dites pas le contraire), si on lui dit de ne pas crawler une URL il ne la crawlera pas, mais rien ne l'empêche de l'indexer s'il trouve un lien qui pointe vers elle. En effet on peut voir parfois un message de ce type dans les SERP :

Celui-ci nous indique qu'il a bien indexé la page mais qu'il ne l'a pas crawlée, évidemment puisque le fichier robots.txt lui indique de ne pas le faire.

Pour désindexer une page de Google, il suffit de mettre en place la balise

<meta name="robots" content="noindex,follow"/>

entre les balises

<head></head>

C'est donc au sein même de la page qu'on indiquera à Google de ne pas indexer une page. Avouez qu'il serait stupide de lui dire (via le robots.txt) de ne pas crawler cette page, il ne verrait pas le message qu'on lui fait passer. :-)

Cordialement, bisou.

Catégorie Astuces référencement | Thématique .

12 réponses à Désindexer une URL de Google

  1. Guillaume says:

    Ah ce sujet m’intéresse !
    Mais je ne peux pas vraiment le mettre en place.
    Sur un site sous wordpress, Google indexe mes fichiers .swf placé dans le /wp-upload
    Alors je me dit un coup de Disallow:/*.swf devrais suffire, mais non il les indexe et m’affiche le message que tu précise.
    Aurais-tu une idée pour éviter l’indexation de fichier swf ? Car on ne peut pas y placer la balise noindex,follow.

    Merci

  2. Rémi says:

    Un article le lundi ? Attention au surmenage.

    Technique testée et approuvée, merci pour le rappel. Bisou.

  3. Armand says:

    Qu’est ce qui t’arrives Sylvain, on n’est pas vendredi ! xD

    Par contre cette méthode pose problème quand il s’agit de liens avec paramètres… ;-) Google a enfin (ça fait juste 4 mois que je lui demande de le faire) décidé de virer mes URLs indexées avec paramètres.
    Supprimer les liens ne suffit pas, il les garde en index quand même… faire une demande de suppression d’URL ne change rien non plus (enfin il en avait supprimé la moitié seulement)… et préciser que ce type d’URL ne doit pas être pris en compte dans Webmaster Tools n’a pas l’air d’avoir beaucoup d’effets non plus. A moins de la faire en amont et non après peut être…

  4. Salut,

    Tu fais bien de rappeler cet état de fait car à mes débuts, combien de fois je me suis fait avoir à insérer dans le robots.txt l’url pour voir que rien ne changeait au final !

    Il faut bien comprendre la différence entre indexation et crawl : Pour qu’une page soit désindexée, il faut au préalable qu’elle soit crawlée ! ;-)

    Bref, comme tu le précises, la meilleure solution est la meta « noindex » …

  5. Valentin says:

    On est dans la base, mais cette rubrique s’avère fort utile. Je lui souhaite un grand succès !

  6. Mythologica says:

    Merci bien pour cette petite piqure de rappel. J’utilise aussi le robots.txt pour donner des directives au crawler et sinon la solution la plus radicale mais qui fonctionne à merveille c’est de bloquer les crawler directement via le htaccess (via le user agent par exemple, utilise pour les spiders chinois, russe etc ;) )

    Au plaisir de vous lire.

  7. John says:

    La solution est radicale ! Mais dans le cas ou la page en question n’existe plus ? Comment faire pour lui dire : Mr cette page n’existe plus, vous ne devez donc plus l’indéxer, ni même la suivre si vous trouver un lien pointant vers cette page sur un autre site internet.

  8. Christian says:

    Tiens, un truc curieux pour tester les connaissances (question piège, attention)
    en plein milieu du body, donc en plein milieu du html, vous mettez :

    ouverture head , la meta name robots sur noIndex, noFollow, fermeture head
    (je n’ai pas mis le code html pour pas mettre le bazar dans cette page, au cas où)

    oui oui, on ajoute une deuxième fois un head et on le met dans le body (au premier niveau du body, pas à l’intérieur d’un div ou autre).

    À votre avis, cela fait quoi ?

  9. Pierre says:

    je me suis fait avoir plusieurs fois avec le robots.txt qui n’est effectivement pas LA solution pour désindexer une page !
    Merci pour le rappel

  10. Les trolls.com says:

    Pas de commentaire constructifs pour moi, mais par contre je relance la question posé plus haut et je la complete;

    Comment fait on alors pour simplement demander la non indexation pour tous les fichiers qui ne peuvent présenter une meta no-index ?

    J’ai bien réussi a diminuer le crawl sur certains sites grâce au fichier robot pour wordpress que nous a gentiment fait part daniel (seomix) mais comme je m’y attendais, toutes ces urls restent dans l’index et sont considéré comme de mauvaises graines ( par exemple on peut le constater en partie dans les GWT comme « pages non sélectionnées » ) …

    Merci d’avance, David.

  11. Sylvain says:

    @Guillaume @Lestrolls : Une autre blogueur a rédigé un article pour compléter celui-ci, je vous laisse aller y jeter un oeil, vous trouverez votre réponse =) http://www.guillaumedesbieys.com/empecher-lindexation-de-certains-types-de-contenus/

  12. BHR says:

    Super astuce que je vais appliquer de ce pas car j’ai deux url différentes qui pointent vers le même contenu. Merci bcp pour l’info.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Veuillez utiliser votre nom ou votre pseudo. Tout commentaire ne respectant pas cette règle verra son lien supprimé.