Definición: Situación en la que el mismo contenido, o contenido sustancialmente similar, es accesible desde múltiples URLs distintas dentro del mismo sitio o entre sitios diferentes.
Causas habituales en un sitio WordPress:
- Acceso por
http://yhttps://, conwwwy sinwww. - URLs con y sin barra final (
/paginavs./pagina/). - Páginas de paginación con el mismo contenido que la página original.
- Páginas de archivo de categoría y etiqueta que repiten los extractos de los artículos.
- Parámetros de URL de seguimiento (
?utm_source=) que generan variantes de la misma URL. - Páginas de búsqueda interna con resultados para sinónimos.
- En multisite: el mismo contenido publicado en varios sitios de la red.
Tipos:
- Duplicado interno: varias URLs dentro del mismo dominio apuntan al mismo contenido.
- Duplicado externo o entre dominios: el mismo contenido existe en dos dominios distintos.
Consecuencias: Los buscadores tienen que decidir cuál de las URLs duplicadas es la “real”. Esta decisión puede no coincidir con la del propietario del sitio. El resultado es que la autoridad del contenido se dispersa entre las variantes en lugar de concentrarse en la URL preferida.
Soluciones:
- Canonical para variantes de la misma URL.
- Redirección 301 para unificar versiones (http→https, www→sin www, con barra→sin barra).
noindexpara páginas de archivo que duplican contenido sin añadir valor.- Parámetros de URL configurados correctamente para que los buscadores los ignoren.
Relacionado con: Canonical, redirección, indexación, faceta.