Le contenu duplicate sur Internet - Ce qu’il faut savoir
9 novembre 2008.
Beaucoup de pages sur Internet ont du texte copié, volé,
dupliqué ou bien distribué créant alors le phénomène de contenu
duplicate qui s’oppose à la création de texte original.
Plusieurs discussions sont maintenant devenus une urgence pour
beaucoup de webmasters car les moteurs de recherche appliquent
de nouveaux filtres pour contrer cette pollution qui souvent ne
respecte pas les droits d’auteurs et crée des pages Web inutiles
aux visiteurs. Nous allons tenter de comprendre les causes
possibles pour lesquelles nous pouvons être pris dans un filtre
et certaines solutions pour les éviter. De plus, nous allons
démontrer comment nous pouvons découvrir si nos pages ont du
contenu duplicate et quoi faire pour modifier cette situation.
Les
spammeurs tentent habituellement de tromper volontairement les
moteurs de recherche afin d’être mieux positionné et ainsi créer
de mauvais résultat concernant les requêtes des internautes. Par
conséquent, nous voyons souvent des pages totalement identiques
et alors il devient difficile de déterminer qui a créé le
contenu original. Ces spammeurs ou webmasters « black hat »
pensent qu’avec la création de pages similaires ou d’autres
copies augmenteront leur chance d’être trouvé selon des mots
clés populaires. Cependant, les moteurs de recherche utilisent
un filtre pour supprimer ces contenus en double dans leur
résultat et ainsi offrir de plus en plus, une qualité
d’information pour l’internaute. D’autre par, certains webmasters tentent et peuvent réussir à déjouer le filtre, mais
cela devient constamment plus difficile et finalement à long
terme, ces pages en double sont supprimées par un nouveau
filtre.
Il est important de comprendre comment fonctionne le filtre (et
non savoir ce qu’il est, car cela est un secret des moteurs)
afin d’éviter d’être bloqué malgré une création originale d’un
site Web. En premier, nous devons prendre en considération qu’il
n’y a pas de punition concernant le contenu duplicate par les
moteurs de recherche, mais seulement une élimination dans
l’indexation des pages par le blocage d’un filtre imposé. Il se
peut aussi que des « bonnes pages » soient accidentellement
filtrées ou bloquées, donc en connaissant le fonctionnement d’un
filtre, nous pouvons prendre des actions préventives. Ainsi, il
existe actuellement quatre types de contenu en double qui sont
filtrés :
Les pages identiques des sites Internet
Si vous avez créé un site Web et que ces mêmes pages Web sont
tous identiques, alors ceci est considéré comme du contenu
duplicate. Quelques fois, des entreprises affiliées prennent le
même contenu que l’entreprise fondatrice pour exposer leur
entreprise affiliée, mais elle copie les mêmes pages et le même
contenu textuel. Ces pages sont évidemment bloquées par le
filtre. utilisez cet outil
Copyscape pour découvrir si une de vos pages a été copiée
entièrement.
Souvent des spammeurs croient qu’en volant une page et en la
mettant sur un autre site pourrait être avantageux, mais c’est
une tentative de manipulation des résultats des moteurs de
recherche et une sanction pourrait être imposée.
Un autre exemple est de créer des pages de porte (doorway).
Souvent ces portes sont faussées par des versions identiques de
pages de destination. Habituellement, les pages satellites (ou
doorway) sont destinés uniquement pour tromper les moteurs de
recherche afin de manipuler les résultats. Une sanction est
imposée.
Contenu superficiel de grande similitude
Ce contenu prend le contenu d'un site Web et le modifie quelque
peut afin de créer un aspect différent, mais en substance, il
n'est rien de plus qu'une page double ou doublon. Avec la
popularité des blogs sur l'internet et la syndication (RSS) de
ces blogs, alors cela devient de plus en plus un problème pour
les moteurs de recherche. Qui n’a pas découvert certains sites
Web qui a pris notre contenu original de notre page Web et la
modifiée quelque peu pour créer une nouvelle page sans faire de
lien vers notre page originale ?
Description de produits dans un site de commerce électronique
Un fabricant crée une fiche de produit qui est alors repris par
des milliers de commerçants vendant son produit et alors ce
contenu est considérer comme duplicate par le filtre des moteurs
de recherche. Il serait sage de créer un contenu différent en
ajoutant plus de texte sur une page de description. Vous pouvez
utiliser cet outil
Webconfs pour voir le pourcentage de similitude entre deux
pages Web.
Publication d’articles dans d’autres sites Web
Si vous croyez quand publiant un article original (ou un
paragraphe) dans les autres sites Web que vous aurez plus de
chance d’être lu ou être visité, alors c’est faux ! Certains
moteurs de recherche ont de la difficulté à savoir qui est le
créateur original de l’article, mais si des liens sont
pointés vers l’article original, alors les moteurs semblent
comprendre où est vraiment l’origine. Cependant, pourquoi ne pas
attendre quelques jours avant d’envoyer votre début d'article sur
d’autres sites et ainsi voir l’article original être indexé en
premier ?