(Mis à jour le: 30 mai 2019)
Duplicate content : comment y mettre un terme ?
4.4 (88%) 5 vote[s]

On a souvent tendance à le négliger et pourtant le Duplicate Content est un point qui influe beaucoup sur le référencement et l’e-réputation de votre site. Deux bonnes raisons pour désormais y prêter plus d’attention …

Le Duplicate Content c’est quoi ?

rédiger contenu unique

Après avoir trouvé un sujet intéressant, vous lancez les recherches et vous mettez à rédiger un article là-dessus. Deux cas peuvent maintenant se présenter en matière de duplicate content :

– 1er cas : avant de publier le texte, vous l’analysez dans un outil de contenu dupliqué et là, soit le texte n’est pas dupliqué et vous pouvez le publier soit vous avez un pourcentage élevé de copié-collé et devez revoir le texte.

– 2e cas : après avoir publié votre texte qui n’était pourtant pas dupliqué, vous vous rendez compte quelques semaines plus tard que votre positionnement est en train de chuter. Vous décidez de consulter votre outil de référencement pour savoir ce qui se passe et là, il vous dit que le texte qui n’était pas dupliqué est dupliqué et que donc il est publié sur d’autres sites qui ne vous appartiennent pourtant pas.

Besoin d'un rédacteur web SEO ! Contactez-nous ...

Le Duplicate Content c’est le fait de retrouver le même contenu sur deux pages web différentes. On a donc un doublon et cela est mal vu par les moteurs de recherche qui vont, pénaliser les sites concernés. Cela explique la baisse de positionnement.

Pourquoi a-t-on du contenu dupliqué ?

Ce qu’il faut savoir c’est qu’avoir un contenu dupliqué peut s’expliquer de diverses manières :

– on manque tellement d’inspiration qu’on se contente de copier le contenu d’un autre site pour alimenter sa page.

– on doit rédiger plusieurs textes similaires comme des fiches produit concernant un même produit qui existe par exemple sous diverses couleurs. Dans ce cas-ci, les descriptions seront à peu près les mêmes puisque seule la donnée « couleur » change.

– on a bien rédigé un contenu unique, mais un autre site a volé notre contenu pour le mettre sur sa page.

– on utilise des tags proches et au final ces derniers vont nous orienter vers les mêmes résultats.

– on a différentes URL pour une même page du site : une avec http, une avec https, une avec www., une sans les 3w, … Comme il s’agit d’une seule et même page, mais qu’on a quatre URLs différentes, il y a duplication.

Avoir plusieurs pages avec un contenu similaire sur un même site est-il une duplication ?

rédaction contenu unique

La réponse est oui. Si l’on reprend l’exemple du produit existant sous différents coloris et que vous rédigez une description pour chaque couleur, vous vous risquez à du Duplicate Content en Interne. Pour éviter cela, il faut bien différencier les descriptions ce qui peut causer quelques soucis surtout si le texte demandé est assez court.

On parle de Duplicate content Interne dans la mesure où le plagiat a lieu sur un seul et même site.
A l’opposé, on parle de Duplicate Content Externe si le plagiat ou le copié-collé concerne deux sites différents. C’est notamment le cas lorsque vous avez repris une partie du texte de votre concurrent ou que celui-ci a copié une partie de votre texte.

Le problème, c’est que si un webmaster malhonnête copie votre texte et que la duplication parvient jusqu’à Google, ce dernier va pénaliser le site le plus faible des deux, bien difficile de pruver sa bonne foi, et cela peut être l’article du copieur qui peut être devant vous sur Google.

Besoin d'un rédacteur web SEO ! Contactez-nous ...

Comment savoir si on a du contenu dupliqué ?

Même si on a fait très attention durant la rédaction, qu’on a bien varié les sources et qu’on a pris soin de bien reformuler les idées, on ne peut jamais être sûr d’avoir sorti un article unique. Il est donc important de faire une vérification de contenu dupliqué avant chaque publication. Pour ce faire, il existe différents outils spécifiquement conçus pour déterminer du plagiat. Parmi les plus performants, on vous recommande :

– Positeo : c’est l’outil le plus utilisé à travers le monde. Il est apprécié pour sa simplicité d’usage et permet d’analyser soit une partie de votre texte soit toute la page en insérant son URL.

– Copyscape : cet outil est également simple à utiliser et aide à analyser le taux de duplication d’une page web.

– Google Search Console : décidément, cet outil a plus d’un tour dans son sac puisqu’à part effectuer les autres analyses courantes, il propose aussi un volet pour partir à la chasse aux doublons. Pour accéder à cette fonctionnalité, il faut se rendre dans la section « Amélioration HTML ». Cette dernière s’intéresse surtout aux méta-description et balises title des sites.
– Screaming Frog SEO : cet outil gratuit permet de détecter du copié-collé dans les balises titles.
– Google : oui, le moteur de recherche Google est également un bon outil pour détecter du contenu dupliqué. Pour ce faire, il vous suffit de mettre entre guillemets « … » les parties du texte que vous souhaitez analyser. Cette fonctionnalité permet de déterminer rapidement si d’autres pages internes ou externes affichent le même contenu que vous.

Que faire si le Duplicate Content Interne est inévitable ?

Oui, cela peut arriver comme lorsque vous avez un produit disponible sous différentes couleurs.
Imaginons par exemple que vous vendez des peluches et que la peluche existe sous trois couleurs différentes. Vous décidez alors de rédiger des fiches descriptives pour chacun d’eux. Même si vous reformulez encore et encore les phrases, les trois descriptions auront toujours de grandes similitudes puisque vous ne pourrez pas changer la matière de conception, les mensurations, les fonctionnalités, … de la peluche et vous ne trouverez pas forcément des synonymes pour les varier à chaque fois. Résultat : le duplicate est inévitable, ce qui risque de faire tomber les pénalités de Google. Que faire dans ce genre de cas ?

Vous devez rédiger vos trois descriptions, les publier puis intégrer une balise dite « canonical » au début de l’URL des autres pages similaires. Dans la version HTML, cela donnera : <link rel=«canonical» href=« https://www.url à indexer/» />

Chaque fois que Google verra cette balise dans les Url, il ne va pas l’indexer pour que la page du produit principal ne soit pas pénalisée. Il ne comptera donc pas la page comme du contenu dupliqué

.
Dans le cas où vous avez du même contenu disponible sur différentes pages à Url différents, il faudra penser à faire des redirections 301.

Besoin d'un rédacteur web SEO ! Contactez-nous ...

Comment faire pour que les autres ne copient pas votre contenu ?

Duplicate content

Puisque le voleur de contenu ne sera pas le seul à être pénalisé, il est important d’appliquer diverses mesures pour qu’on ne puisse pas copier vos textes. Voici quelques astuces à adopter :

– Bien insérer la mention Copyright et Mentions légales sur votre site/blog :
En règle générale, tout ce que vous publiez sur votre site vous appartient et est donc protégé par un droit d’auteur. Si pour la majorité des rédacteurs et webmasters, cela va de soi même si vous n’insérez pas la mention Copyright, pour d’autres, tant que ladite mention n’est pas visible, ils se permettent de copier-coller vos articles. Et même lorsqu’elle est bien là, ils osent quand même vous piquer vos textes. Il faut donc la mentionner de manière claire en bas de chaque page du site ou du blog pour un effet dissuasif, même si cela ne marche pas toujours.

En ce qui concerne les Mentions légales, elles donnent une certaine légitimité à votre site. Certes, elles n’ont pas grand pouvoir sur les webmasters peu scrupuleux, mais c’est déjà un bon début pour essayer de se protéger du plagiat.

– Ne plus permettre le « clic droit » :
Quand quelqu’un s’apprête à copier une image, une vidéo ou un texte, il commence par faire un clic droit de la page. C’est là qu’il va retrouver la fonction « Copier » puis « Coller ».
Pour qu’on ne vous vole pas vos contenus, il peut être judicieux de bloquer cette fonctionnalité. La technique varie d’un éditeur. Sur WordPress, il faudra alors installer le WP-CopyrightProtect qui empêche tout clic droit sur votre site.

– Ne plus permettre la sélection de texte :
Le fait de sélectionner un texte peut indiquer que la personne s’apprête à le copier ? Bloquer cette fonctionnalité peut alors être intéressant puisque sans sélection, il n’y aura pas de copie. Pour ce faire, il suffit de trouver le bon code à insérer sur l’éditeur et voilà, vos contenus sont saufs.

– Publier ses contenus sur les réseaux sociaux sitôt publiés :
Ce peut être un excellent moyen pour revendiquer haut et fort que vous êtes l’auteur de tel ou tel contenu. Ainsi, chaque fois que vous aurez fini de publier un texte, partagez-le sur les réseaux sociaux que vous utilisez. Non seulement, cela prouvera que ce sont vos articles publiés sur votre site, mais c’est aussi un bon moyen pour bien les référencer.

Si vous craignez de manquer de temps pour cela, pensez à utiliser un outil de partage automatisé comme Buffer, Jetpack, …

– Insérer votre signature :
Google n’utilise plus la balise Authorship depuis longtemps, mais il existe diverses techniques qui lui permettent de savoir qui est l’auteur du texte. Parmi elles, il y a le fait de bien renseigner les données d’auteur demandées sur le blog. Si vous remplissez correctement les paramètres, vous verrez votre nom apparaître automatiquement sur la page de publication une fois le texte en ligne ainsi que sur toutes les pages de votre site.

Bien sûr, cela n’empêche pas vraiment les autres de copier vos contenus, mais associez aux autres méthodes citées plus haut, la signature peut être intéressante.

– Avoir une indexation rapide de la page pour que Google vous en attribue la paternité :
Pour ne pas laisser le temps aux autres de copier votre contenu avant que votre page ne soit indexée par Google, utilisez un outil d’indexation ou un Ping pour demander à ce moteur de recherche de l’indexer en priorité.

Grâce à ce type d’outil, l’indexation se fera rapidement. Il existe différents outils pour cela et certains permettent même d’automatiser les pings.

Une fois que Google aura indexé la page et qu’il ne détecte pas encore de Duplicate, il vous en attribuera automatiquement le mérite. Si plus tard, un autre site venait à vous copier, le moteur de recherche n’aura aucun mal à déterminer qui est le copieur à pénaliser.

Besoin de rédaction de contenu unique ! Contactez-nous ...

– Contacter le copieur :

Si malgré toutes ces astuces, quelqu’un venait quand même à copier votre article, la solution la plus simple consiste à la contacter rapidement pour lui demander soit de supprimer le texte de son site soit de mentionner sur la page qu’elle a empruntée ou qu’elle s’est inspirée de votre site. En général, cette requête suffit pour avoir gain de cause, mais parfois, on fait face au silence de la partie adverse ou à son refus de supprimer le texte en en revendiquant tout simplement la paternité.

Dans ce cas-là, vous pouvez contacter l’hébergeur pour que ce dernier interpelle à son tour le webmaster. Au pire, vous pouvez faire appel à la justice, mais espérons que vous n’en arriverez jamais là.