Le contenu duplicate sur Internet - Ce qu’il faut savoir


9 novembre 2008. Beaucoup de pages sur Internet ont du texte copié, volé, dupliqué ou bien distribué créant alors le phénomène de contenu duplicate qui s’oppose à la création de texte original. Plusieurs discussions sont maintenant devenus une urgence pour beaucoup de webmasters car les moteurs de recherche appliquent de nouveaux filtres pour contrer cette pollution qui souvent ne respecte pas les droits d’auteurs et crée des pages Web inutiles aux visiteurs. Nous allons tenter de comprendre les causes possibles pour lesquelles nous pouvons être pris dans un filtre et certaines solutions pour les éviter. De plus, nous allons démontrer comment nous pouvons découvrir si nos pages ont du contenu duplicate et quoi faire pour modifier cette situation.
 


 

Les spammeurs tentent habituellement de tromper volontairement les moteurs de recherche afin d’être mieux positionné et ainsi créer de mauvais résultat concernant les requêtes des internautes. Par conséquent, nous voyons souvent des pages totalement identiques et alors il devient difficile de déterminer qui a créé le contenu original. Ces spammeurs ou webmasters « black hat » pensent qu’avec la création de pages similaires ou d’autres copies augmenteront leur chance d’être trouvé selon des mots clés populaires. Cependant, les moteurs de recherche utilisent un filtre pour supprimer ces contenus en double dans leur résultat et ainsi offrir de plus en plus, une qualité d’information pour l’internaute. D’autre par, certains webmasters tentent et peuvent réussir à déjouer le filtre, mais cela devient constamment plus difficile et finalement à long terme, ces pages en double sont supprimées par un nouveau filtre.

Il est important de comprendre comment fonctionne le filtre (et non savoir ce qu’il est, car cela est un secret des moteurs) afin d’éviter d’être bloqué malgré une création originale d’un site Web. En premier, nous devons prendre en considération qu’il n’y a pas de punition concernant le contenu duplicate par les moteurs de recherche, mais seulement une élimination dans l’indexation des pages par le blocage d’un filtre imposé. Il se peut aussi que des « bonnes pages » soient accidentellement filtrées ou bloquées, donc en connaissant le fonctionnement d’un filtre, nous pouvons prendre des actions préventives. Ainsi, il existe actuellement quatre types de contenu en double qui sont filtrés :


Les pages identiques des sites Internet
Si vous avez créé un site Web et que ces mêmes pages Web sont tous identiques, alors ceci est considéré comme du contenu duplicate. Quelques fois, des entreprises affiliées prennent le même contenu que l’entreprise fondatrice pour exposer leur entreprise affiliée, mais elle copie les mêmes pages et le même contenu textuel. Ces pages sont évidemment bloquées par le filtre. utilisez cet outil Copyscape pour découvrir si une de vos pages a été copiée entièrement.

Souvent des spammeurs croient qu’en volant une page et en la mettant sur un autre site pourrait être avantageux, mais c’est une tentative de manipulation des résultats des moteurs de recherche et une sanction pourrait être imposée.

Un autre exemple est de créer des pages de porte (doorway). Souvent ces portes sont faussées par des versions identiques de pages de destination. Habituellement, les pages satellites (ou doorway) sont destinés uniquement pour tromper les moteurs de recherche afin de manipuler les résultats. Une sanction est imposée.

Contenu superficiel de grande similitude
Ce contenu prend le contenu d'un site Web et le modifie quelque peut afin de créer un aspect différent, mais en substance, il n'est rien de plus qu'une page double ou doublon. Avec la popularité des blogs sur l'internet et la syndication (RSS) de ces blogs, alors cela devient de plus en plus un problème pour les moteurs de recherche. Qui n’a pas découvert certains sites Web qui a pris notre contenu original de notre page Web et la modifiée quelque peu pour créer une nouvelle page sans faire de lien vers notre page originale ?

Description de produits dans un site de commerce électronique
Un fabricant crée une fiche de produit qui est alors repris par des milliers de commerçants vendant son produit et alors ce contenu est considérer comme duplicate par le filtre des moteurs de recherche. Il serait sage de créer un contenu différent en ajoutant plus de texte sur une page de description. Vous pouvez utiliser cet outil Webconfs pour voir le pourcentage de similitude entre deux pages Web.

Publication d’articles dans d’autres sites Web
Si vous croyez quand publiant un article original (ou un paragraphe) dans les autres sites Web que vous aurez plus de chance d’être lu ou être visité, alors c’est faux ! Certains moteurs de recherche ont de la difficulté à savoir qui est le créateur original de l’article, mais si des liens sont pointés vers l’article original, alors les moteurs semblent comprendre où est vraiment l’origine. Cependant, pourquoi ne pas attendre quelques jours avant d’envoyer votre début d'article sur d’autres sites et ainsi voir l’article original être indexé en premier ?