Le duplicate content, on reprend…
Le duplicate content est une plaie, surtout depuis que Google Panda est venu démolir de trop nombreux sites sans aucun rapport avec les MFA.
Ayant été confronté de près aux problématiques de duplicate content et ayant dû les résoudre pour le développement du logiciel « Human Easy Spinner », le billet livre ici quelques pistes de réflexion, dont certaines éventuellement inédites, sur le contenu dupliqué.
Cela démarre doucement. On pose quelques idées, notamment sur les phases préparatoires possibles avant de lancer le calcul de similitude, phases préalables si souvent ignorées.
Avoir x % de contenu dupliqué sur un texte ne permet pas de savoir, de prime abord, si on est dans les clous vis-à-vis de Panda.
Peut-être faut-il se creuser davantage ?
Quelques-unes de nos pistes de réflexion, issues de nos constats et tests, sont livrées ici (pas toutes quand même ;-)
Premier billet d’une série de trois sur le duplicate content [dans ce premier billet, l’introduction à la problématique du contenu dupliqué]