3ème partie : Audit SEO – Contenu

Stylo plumeÇa y est, vous avez les bases en ce qui concerne la partie technique d'un audit de référencement, maintenant il va falloir s'attaquer à la partie contenu. Vous avez trouvé le travail sur l'aspect technique fastidieux ? Réjouissez-vous, ici ça va être encore pire !

Pire parce qu'il est quasi impossible d'automatiser une analyse de contenu car souvent les ressources vous feront défaut ; pire parce que cette même analyse est purement subjective, contrairement à tous les autres aspects de l'audit SEO ; pire parce qu'il va falloir presque tout faire à la main ; pire parce que plus il y a de pages, plus vous aller y passer du temps. Vous êtes quand même prêt à continuer ? C'est parti !

Repérage du contenu dupliqué

Si vous avez construit vous-meme votre propre crawler et que vous avez les ressources nécessaires, alors ce travail sera facilité. Idéalement, votre crawler a repéré la zone où se trouve le contenu effectif des pages (ie le contenu sans l'en-tête, les sidebars et le footer), il ne vous restera donc plus qu'à filtrer les données récupérées et vérifier la présence de doublons.

Dans les faits, ceci n'arrive quasiment jamais, vous imaginez les ressources nécessaires pour un site de 100 000 pages ? Donc on va jouer un peu différemment. S'il n'est pas aussi puissant, notre crawler a tout de même récupéré les balises Title, Meta description, H1 et H2. Screaming Frog le fait, d'ailleurs ;-) On va pouvoir commencer par filtrer ces données pour repérer les doublons, au moins pour la balise Title. Si on trouve des Title doubles, c'est mal, et si après vérification on voit que les pages ont le même contenu, c'est encore pire !

Google Webmaster Tools nous indique les balises Title et Description dupliquées dans la catégrie Optimisations ==> Améliorations HTML.

Une vérification "à la scout" sera toujours intéressante : vous sélectionnez quelques pages, vous copiez une ligne du contenu au hasard et vous allez la coller dans Google sous la forme suivante :

"ligne que vous venez de copier" site:site-audité.fr

Vous saurez ainsi si Google connait plusieurs pages de votre site ayant le même contenu. Évidemment vous n'allez pas le faire sur toutes les pages du site mais simplement sur une sélection de différentes typologies de pages.

Concernant le contenu dupliqué sur d'autre sites, c'est un peu la même façon de faire, la partie "site:" en moins. Plus simplement, vous pouvez également demander au client comment sont gérés ses contenus : les fiches produits sont-elles des copies des fiches du fabricant ? Il saura vous répondre, et devra le faire. Hey ! Vous bossez avec lui, pas uniquement pour lui !

 La qualité du contenu

Sujet brûlant tant il dépend de la stratégie et donc des objectifs, la qualité est tout de même importante. Même si globalement ça devrait aller assez vite sur ce point, on commence par ce qui va plaire à Mme Duchez (votre prof de français de troisième), ses dissertations et son Bescherelle :

  • vérification de l'orthographe
  • vérification de la grammaire
  • vérification de la valeur ajoutée du texte

Une fois ces vérifications effectuées, il va falloir comprendre si le champ lexical est optimal : vise-t-il les meilleures expressions ? Les expressions visées sont-elles réalistes (ie : le positionnement sur ces expressions est-il réalisable, en prenant en compte le background du site) ? Sont-elles génératrices de trafic ? Et surtout, le plus important, sont-elles adaptées à la cible ?

Keyword stuffing et "keyword missing"

Le keyword stuffing est la répétition d'un mot clé, mais de façon bien trop importante. C'est une pratique que les moteurs repèrent et sanctionnent à plus ou moins forte échelle, c'est donc une pratique à éviter. Il est donc important de se poser la question si le site est sujet ou non au keyword stuffing :

  • plusieurs occurrences de l'expression dans le Title
  • utilisation de l'expression dans l'URL
  • utilisation de l'expression dans le H1 et chacun des H2
  • répétition trop importante de l'expression dans le texte
  • mise en place de l'expression dans l'attribut alternatif des images
  • etc.

À l'inverse on retrouve ce qu'on pourrait appeler le "keyword missing". Pour faire simple, c'est le fait de vouloir se placer sur une expression sans l'utiliser dans la page, ou en l'utilisant trop peu. Au final, on reprend à peu près les mêmes points que précédemment mais on recherche l'effet inverse :

  • l'expression n'est pas utilisée dans le Title
  • l'expression (ou une de ses variantes) n'est pas utilisée dans le H1
  • l'expression n'est jamais citée dans les textes
  • etc.

Mais comment repérer tout ça ? Quel est le taux idéal d'occurrences d'un mot clé dans une page ? Honnêtement, je n'en ai aucune idée, je m'en contrefous et je ne suis même pas sûr qu'il y ait un "taux idéal" quelque part dans l'algorithme de Google. La façon la plus simple de repérer un de ces deux extrêmes est de lire le texte. Si ce dernier utilise une expression si souvent qu'il en devient indigeste, alors c'est du keyword stuffing. Si vous n'arrivez pas à résumer le sujet d'une page en deux ou trois mots, ou que l'expression qui semblerait la plus pertinente n'apparait pas, alors c'est du keyword missing.

La taille des textes

Là encore on est vraiment dans le "très subjectif" et ici aussi, je serais tout simplement incapable de définir un volume de texte optimal. Lorsque vous auditez les textes d'un site, le plus pertinent est de se mettre dans la peau d'un internaute : se sent-il lésé concernant l'information partagée ou au contraire se sent-il étouffé par une quantité de textes si énorme qu'elle en devient imbuvable ? Dans ce deuxième cas, le texte ne mérite-t-il pas d'être divisé en plusieurs pages ?

Google veut proposer quelque chose qui plait à l'internaute. Si à la première vision un texte ne vous plait pas, il en sera autant pour tous les autres internautes.

Les autres types de contenu

Si le texte est le seul type de contenu que Google sait lire, c'est loin d'être le seul contenu disponible sur internet. Les autres contenus sont pourtant bien susceptibles d'être présents sur le site audité. Quid des images ? L'attribut alternatif est-il renseigné ? Le nom du fichier est-il descriptif ? Un texte explicatif les accompagne-t-il ? Même chose pour les vidéos, les sons, les présentations, les formulaires, etc. : sont-ils accompagnés d'un environnement susceptible de les définir ?

Acteurs du web

Nous venons de terminer un bon tour du propriétaire après avoir réalisé la partie technique et la partie contenu de l'audit de référencement. Vous pensez en avoir fini ? Non, bien sûr que non ! Ça tombe alors très bien puisque vous pourrez revenir demain pour vous attaquer à la partie statistique de l'audit ;-)

Audit SEO : Le dossier complet
Pré-requis 
Audit technique
Audit de contenu (cet article)
Analyses statistiques
Audit de visibilité
Audit de liens
La vision sociale
Et après ?

Catégorie Référencement | Thématique .

18 réponses à 3ème partie : Audit SEO – Contenu

  1. Je rajouterai qu’il faut vérifier qu’il n’y ai pas trop de publicité sur les pages web du site.
    De plus, si on découvre du contenu dupliqué, est ce que le webmaster est au courant de ce contenu duppliqué en mettant en place une canonical par exemple.

    Comme tu dis, il existe d’autres type de contenus que le contenu textuel. Mais est ce qu’un site sans images, avec uniquement du contenu textuel est une bonne chose ? Ne vaut-il pas mieux inserer quelques images au sein d’un site web ? Tout ça dans le but de paraitre plus naturel pour Google. Après je ne pense pas qu’on puisse le savoir, mais bon…

  2. Hamza says:

    Bonjour Sylvain et merci pour ce dossier très complet, ça m’aide tellement dans mon expérience de seo/blogueur

    Je me posais depuis un bon la question : Sur un site, la page d’accueil manque de contenu, est-ce que c’est le référenceur qui s’en charge ou bien le client ? Car des fois, y a un site avec un sujet que je connais pas, qui manque de contenu…

  3. RaphSEo says:

    Hello Sylvain,très sympa ta série de billets et conseils sur la technique et méthodo d’un audit.
    Sans vouloir trop en dire jettez un oeil à cette page http://www.visibilite-referencement.fr/blog/bookmarklet-seo (oui je sais elle est de moi mais ce n’est pas pour cette raison. )
    Regardez le bookmarklet sur la duplication de title. Ce n’est qu’un exemple, creusez vous un peu la tête ;)
    ++
    Raph

  4. Lionel says:

    Je ne pense pas qu’il y ait de densité idéale, et d’ailleurs Google l’a affirmé (même si ça ne prouve rien). Ce qui est sur c’est que si le mot n’est pas présent au moins une fois dans le texte c’est impossible à ranker, même avec des BL contenant le mot clé en question.
    Une bonne solution pour le keyword stuffing est de remplacer par des synonymes.

  5. lionel says:

    Bonjour Sylvain,

    Google constitue un robot qui juge un texte suivant des critères assez basiques tels que : la duplication de contenu, la répétition des mots-clés, la répétition des occurrences, le contexte, la structure, la titraille…

    Ceci étant, je pense aussi qu’un auditeur doit être en mesure de conseiller sur un contenu textuel optimisé à la fois pour le référencement mais également sur sa capacité à remplir un objectif de conversion… un équilibre à gérer et pas toujours évident !

  6. rocketSeo says:

    Super intéressant, personnellement je ne connaissais pas la notion de keyword missing, enfin je veux dire la façon de nommer ce constat. Par contre, il me semble qu il manque tout de même quelque chose d assez fondamentale : tout ce qui concerne le balisage (headings). en effet, on en parle pas dans le technique et dans le contenu…Du coup, je me demandais quand cela sera abordé. mais je suis peut être un peu impatient… ;)

    J attends avec impatience votre vision de l’audit netlinking… il y a surement de bonnes idées à reprendre. En tout cas, le fait le couper vos articles en différents feuilletons est une bonne idée. C est à a la fois agréable et addictif pour l internaute.

  7. GreenArrowFrance says:

    Merci beaucoup pour ces conseils. Je suis très intéressé par Screaming Frog maintenant que tu as décrit ses fonctionnalités. Je vais le télécharger pour tester, il m’a l’air d’être un outil parfait pour optimiser le contenu du site en particulier pour le duplicate content.

  8. Sylvain says:

    @Hamza : tout dépend du prix de la presta, de ce qui y est inclus, etc. Après, le rôle du SEO est quand même de se rencarder sur l’activité de son client ;-) Si jamais tu ne te sens pas chaud, tu peux demander au client de simplement lister des points qui lui paraissent importants et que tu te charges de mettre en forme.

    @Raph : dis donc, c’est fini de citer tes articles comme source d’infos supplémentaires dans mes commentaires, oui ? Un lecteur a déjà cité ton article sur Screaming Frog dans l’article sur la technique :D Mais oui en effet, c’est également une possibilité supplémentaire ;-)

    @rocketseo : ah oui tiens, c’est un oubli de ma part, ça devait effectivement aller dans cet article. Je suis bon pour le corriger maintenant ;-) Pour la notion de keyword missing, c’est pas illogique que tu n’en aies pas entendu parler avant puisque l’expression m’est venue en rédigeant !

  9. James says:

    La bonne taille d’un texte, c’est une question que je me suis toujours posé, mais c’est vrai que je n’avais pas abordé le sujet de cette manière, en me mettant à la place de l’internaute, ce qui en plus très logique. Donc désormais je ferai en sorte que les textes soient informatif juste ce qu’il le faut avec une densité moyenne de mots clés, sans forcément me dire qu’il n’est pas assez long ou parfois trop.

  10. RaphSEO says:

    Sylvain, loin de moi l’idée de vouloir te spammer :)
    Mais c’est de ta faute, tu n’as qu’à écrire des choses nulles et stupides et je ne viendrais pas chez toi :D
    Plus sérieusement c’est ta commande « ligne que vous venez de copier » site:site-audité.fr qui m’y a fait penser.
    Vu que je l’ai semi-automatisée avec le bookmarklet je pensais que cela pourrait intéresser tes lecteurs.

  11. Sylvain says:

    @Raph : pas de soucis, tu sais ce que j’en pense : si c’est bon pour le lecteur, alors c’est bon pour moi ;-)

  12. Véronique Duong says:

    Merci pour la suite de ce dossier « Audit SEO » ! C’est vrai que pour l’audit contenu sémantique, il vaut mieux le retravailler le plus humainement possible pour s’assurer de la qualité.

  13. gab says:

    Je pense qu’il nous est impossible de connaitre la densité de mots clés acceptée par Google.

    [Par contre il est facilement possible de reconnaitre les spammeurs compulsifs]

  14. Jerry says:

    Super article, il y manque juste le linkbaiting non ? @rocketSeo : le keyword missing est une tactique principalement utilisée par les blogs et/ou sites soupçonnés voire pénalisés d’avoir abusé du SEO. Ca leur permet de se faire comprendre de l’internaute en travaillant sur des keywords alternatifs mais connexes à la thématique de leur moneysite.

  15. Jerome says:

    Quand tu cherches le contenu dupliqué, ta façon de faire permet de trouver le DUST (dupliqué interne), mais pas le dupliqué externe. Le dupliqué interne est moins grave que le dupliqué externe. Mais tu as raison de dire que dans les 2 cas, c’est un problème à résoudre.

  16. Monica says:

    Bonne technique que de feuilletonner les bons plans du SEO: une technique journalistique à la Médiapart sauf qu’il n’y a pas de scandale politico-financier dans tes billets, mais cependant une grande tendance à l’humilité. A l’heure où ou GG multiplie les variables, les filtres, les stratégies, les outils, cela devient en effet irrationnel d’affirmer une théorie parfaite.
    Ton ode au TRES SUBJECTIF est le filigrane de ce billet: ben oui, taille de texte, densité de mots-clef, qualité de contenu, tout cela a sombré dans l’abstraction en même temps me que GG s’attaque au continent immergé de la sémantique.
    Par contre dans un registre plus concret, tes armes anti-duplicate ne font pas dans la dentelle. J’ajouterai que stratégiquement se renforcer au niveau de l’Author-rank permet de passer outre le problème, mais est-ce bien rationnel là aussi?

  17. Sylvain says:

    @Monica : Et bien, très beau commentaire ! Je rebondis sur l’Author Rank : je ne saurais dire si c’est rationnel ou non, tout dépend de la stratégie de l’entreprise. Quid d’une entreprise qui fait rédiger ses textes ailleurs ? Je ne pense pas qu’il soit rationnel de lier un compte auteur à ces contenus, pas toujours de bonne qualité. Mais dans ce cas, pourquoi externaliser son contenu ? C’est toute une stratégie à revoir du coup =)

  18. Hug0b says:

    Le contenu, un des paramètres essentiel d’un site web « content is king ». Après concernant la densité des KW, c’est toujours autant le flou autour de cette donnée, y’a des pour, y’a des contres, on sait plus trop quoi penser …

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Veuillez utiliser votre nom ou votre pseudo. Tout commentaire ne respectant pas cette règle verra son lien supprimé.