(Mis à jour le: 4 août 2020)

Le duplicate content : comment le détecter ?

Avoir du contenu dupliqué peut faire chuter un site dans les SERPs de manière brutale. Vous pouvez aussi écoper d’une sanction sévère de la part de Google. Pour éviter pareil cas et pour ne pas voir ses efforts en référencement réduits à néant, il faut toujours éviter le duplicate content. Mais si la duplication n’est pas intentionnelle ou ne vient pas de vous, que faire et comment détecter cela ? Voici nos conseils …

Trouvez facilement un rédacteur professionnel sur Redigeons.com

Contacter nous pour commander des textes

Petit rappel sur le duplicate content

Le duplicate content est le fait de copier le contenu d’un autre site. C’est du copie-collé pur et dur. Dans la majorité des cas, il est fait exprès et les moteurs de recherche, dont Google, n’apprécient pas du tout. Il arrive toutefois que les causes du contenu dupliqué soient non intentionnelles, mais reste quand même punissable.

Lorsque les moteurs de recherche détectent des contenus semblables sur deux sites différents, ils penseront tout de suite à de la duplication. Vont-ils punir les deux sites d’office ? Pas forcément. Lorsque les robots crawlers peuvent retracer la paternité du contenu, seul le site copieur sera pénalisé. Et dans le cas contraire, copieur et copié seront automatiquement pénalisés.

Il est donc important de ne pas copier les autres et aussi de ne pas se faire copier. Dans le premier cas, il vous incombera de respecter le travail d’autrui. Pour ce faire, découvrez comment éviter et prévenir le duplicate content. Dans le second cas, il vous reviendra aussi de détecter d’éventuelles copies de vos contenus et d’agir rapidement pour éviter les sanctions. Cette tâche doit être faire de manière régulière. N’attendez pas de chuter dans les résultats de recherche pour agir, car il sera alors trop tard.

Comment savoir si on a été copié ?

Pour détecter d’éventuels vols de contenus, vous pouvez, soit mener une recherche directement sur Google, soit utiliser des outils pour la détection de duplicate content.

Mener une recherche sur Google est la manière la plus simple. Vous avez deux méthodes.

  • Dans la barre de recherche, ouvrez les guillemets, copiez une bribe du contenu à analyser puis fermez les guillemets. En quelques secondes, le moteur de recherche affichera tous les sites qui contiennent ce contenu. L’analyse se fera entre votre site et les autres sites du web. Cette technique vous permet de savoir si on vous a copié ou si votre contenu est trop proche de celui d’un autre site, par exemple le site dont vous vous êtes inspiré.
  • Dans la barre de recherche, saisissez la formule suivante : site:monsite.com intitle :« mots clés ou expression clé ». Comme dans la première méthode, le moteur de recherche va afficher les pages de votre site qui contiennent exactement le terme que vous avez saisi entre guillemets. Ici, l’analyse se fait exclusivement sur votre site ce qui vous permettra de voir si certaines de vos pages sont dupliquées entre elles. Cela peut effectivement arriver donc à vous de les dépareiller si la recherche est positive.

A lire – Audit SEO : les bons moments pour le faire

Des contenus copiés, mais non dupliqués

Il y a des cas où on pense avoir dupliqué du contenu, mais que les moteurs de recherche ne considèrent pas comme tel. Comment cela se fait-il ? Deux cas peuvent en être à l’origine à savoir :

  • Deux contenus semblables, mais l’un publié sur le site desktop et l’autre publié sur le site mobile :

De nombreux webmasters possèdent deux versions de leur site : la version desktop et la version mobile. Si vous faites partie de ceux-là, il est fort possible que vos contenus soient exactement les mêmes sur les deux sites (et donc sur deux urls différentes). Rassurez-vous, les moteurs de recherche ne vont pas vous pénaliser pour duplication et pour cause : ils utilisent des robots crawlers différents pour l’indexation sur desktop et l’indexation mobile.

Autrement dit, les robots affectés à l’indexation des sites mobiles ne pourront pas analyser les sites desktop et vice-versa. Chacun d’eux trouvera donc un contenu unique.

Lire aussi – Structure des urls : comment la rendre SEO friendly ?

  • Des contenus traduits :

Pour obtenir un contenu web, il est possible de choisir le contenu d’un site en anglais, par exemple, de le traduire en français et de publier cette version traduite sur votre site. Vu ainsi, cela consiste à copier les idées de l’autre site et pourrait passer pour de la duplication.

Toutefois, comme le site source est dans une autre langue et qu’il y a eu traduction, les moteurs de recherche n’y verront pas du contenu dupliqué. Il s’agira de deux contenus, avec les mêmes idées et parfois même la même structure, mais dans des langues différentes. En somme, on aura deux contenus différents.

Attention toutefois, pour que cette astuce fonctionne, il faudra soigner la traduction. Il faut éviter les mot-à-mot ou les traductions trop maladroites, car cela pourrait passer pour de la duplication. C’est souvent le cas lorsqu’on utilise un outil de traduction. Le mieux c’est de faire appel à un traducteur « humain » professionnel. Ce dernier saura traduire le texte en restant fidèle aux idées et au contexte général. Si vous souhaitez vous contenter des outils de traduction, pensez à revoir le texte traduit et à l’améliorer un peu avant de le mettre en ligne.

Lire aussi – Comment faire une rédaction en anglais ?

Quels outils utiliser pour détecter du duplicate content ?

Quels outils utiliser pour détecter du duplicate content ?

Il existe de nombreux outils pour détecter le duplicate content. Outre ceux qui sont déjà cités sur 6 logiciels gratuits anti-plagiat à essayer, on a également :

Siteliner :

Cet outil analyse les éventuelles duplications sur votre site. Il va étudier toutes les pages d’un même site, se focaliser sur les pages que Google a dans son viseur et détecter les liens rompus. Son utilisation vous permettra de corriger rapidement vos erreurs. Il est possible d’associer Siteliner à d’autres outils de duplicate content comme Copyscape. Lorsque Siteliner aura affiché des urls douteuses sur votre site, vous copiez l’url dans Copyscape pour voir si le contenu est aussi repris sur d’autres sites. Ainsi, vous aurez une expertise internet et externe.

Screaming Frog :

Cet outil s’intéresse aussi aux contenus de votre site. Durant son analyse, il passera en revue les urls, les titres, les entêtes et les contenus de vos pages. Il part aussi à la chasse aux liens rompus, aux métadonnées et aux erreurs de serveur. Il va sortir tous les doublons qui existent sur votre site ce qui vous permettra de vous corriger facilement par la suite.

Copyfight :

Cet outil garde un œil sur vos contenus afin que les autres ne puissent pas les copier. Il dispose d’une extension à installer sur WordPress ce qui le rend pratique et aussi performant. Notez qu’il ne s’intéresse pas seulement aux contenus textuels, mais vous avertit aussi si on tente de copier vos photos. Grâce aux résultats qu’il affiche, vous pourrez réagir rapidement et éviter toute copie de vos contenus.

Lire aussi – De belles images pour son site web

Quetext :

Le gros avantage de cet outil c’est qu’il est capable d’analyser jusqu’à 25 000 mots en une expertise. Autrement dit, il est celui à utiliser pour analyser un contenu très très long de plus de 50 pages. Il peut également uploader jusqu’à cinq formats de contenus ce qui le rend ultra pratique.

Grammarly :

Comme tous les rédacteurs, vous vous êtes sûrement inspirés d’autres sources sur le web pour rédiger vos contenus. Vous avez donc pris soin de bien reformuler les idées des autres, mais il arrive qu’on n’ait pas reformulé suffisamment certaines phrases. Grammarly vous aide à les détecter afin que vous puissiez y remédier rapidement. Il va même jusqu’à vous proposer des synonymes et des paraphrases pour que vous ne tombiez pas dans la duplication. Enfin, il donne un score d’originalité à chaque contenu analysé pour déterminer à quel point les contenus sont uniques ou non.

Kill Duplicate :

Kill Duplicate est très utile pour déterminer ces sites qui pensent pouvoir voler vos contenus. Pour l’utiliser, il suffit de vous inscrire sur la plateforme et la laissez ensuite faire son travail. L’analyse se fait en temps réel donc chaque fois que quelqu’un publie un contenu copié depuis un des vôtres, l’outil vous avertira.

Duplichecker :

Pour l’utiliser, il suffit de copier-coller votre contenu que l’outil et de lancer la recherche. En quelques secondes, vous saurez s’il est dupliqué ou non. En parallèle, il va corriger les fautes de grammaire et vérifier vos images.