Qué indexar


Una de las decisiones más importantes en la arquitectura de la información de un sitio web es determinar qué páginas deben estar en el índice de los buscadores y cuáles no. No es una decisión automática ni trivial: indexar páginas sin valor añadido diluye la calidad percibida del sitio; no indexar páginas que merecen visibilidad desperdicia potencial.

Este artículo establece los criterios para tomar esa decisión con fundamento.


El principio base: indexar lo que aporta valor único

La pregunta que debe hacerse para cualquier URL es: ¿aporta esta página valor único y suficiente para un usuario que llega desde un buscador?

Si la respuesta es sí, la página debe indexarse. Si la respuesta es no, o si el valor que aporta ya está mejor cubierto por otra página del sitio, la página probablemente no debe indexarse.

“Valor único” significa que la página tiene contenido propio que no es simplemente un subconjunto o una reorganización de otro contenido del sitio. “Valor suficiente” significa que ese contenido es útil, completo y relevante para quien llega a esa página desde una búsqueda.


Categorías de páginas y su decisión de indexación

Contenido principal — Indexar siempre

Son las páginas que constituyen el núcleo del sitio: artículos, fichas de producto, páginas de curso, entradas del glosario, documentación. Estas páginas tienen contenido original, único y de valor. Deben indexarse sin excepción.

Páginas estáticas principales — Indexar

Portada, sobre nosotros, contacto, páginas de sección. Son puntos de entrada importantes del sitio con contenido propio. Se indexan.

Excepción: páginas de confirmación de formulario (/gracias//pedido-confirmado/). Estas páginas no tienen valor para un usuario que llega desde un buscador; son el destino de una acción, no un punto de entrada. Se ponen en noindex.

Archivos de categoría — Decisión según contenido

Los archivos de categoría (la página que lista todos los contenidos de una categoría) pueden indexarse si:

  • Tienen una descripción editorial propia que añade contexto.
  • Tienen suficientes contenidos asociados (una categoría con dos artículos no justifica una página de archivo indexable).
  • El conjunto de contenidos de esa categoría tiene interés como unidad para un usuario que busca ese tema.

No deben indexarse si son simplemente una lista de extractos sin contenido editorial propio, o si la categoría tiene tan pocos contenidos que la página no aporta valor diferencial.

Archivos de etiqueta — Generalmente noindex

Las páginas de archivo de etiqueta raramente deben indexarse. Son listas de artículos agrupados por un atributo específico, sin narrativa editorial propia, con frecuencia escasas en contenido. La excepción son las etiquetas con un volumen alto de contenidos relevantes y con suficiente interés de búsqueda como unidad temática.

Páginas de paginación — Generalmente noindex

/blog/pagina/2//categoria/wordpress/pagina/3/… Estas páginas son subconjuntos del archivo principal, sin contenido adicional. La página 1 del archivo se indexa; las páginas siguientes, generalmente no. La excepción es cuando el volumen de contenido es tan alto que las páginas de paginación tienen relevancia propia, pero esto es infrecuente.

Páginas de búsqueda interna — Noindex siempre

Los resultados de la búsqueda interna del sitio nunca deben indexarse. Son páginas generadas dinámicamente cuyo contenido varía según la consulta, sin valor propio, potencialmente infinitas en número y con alto riesgo de generar contenido duplicado. La regla es absoluta: noindex para todas las URLs que incluyan el parámetro de búsqueda interna.

Páginas de administración y acceso privado — Noindex + bloqueo en robots.txt

Las páginas de administración del CMS, las páginas de inicio de sesión, los paneles de usuario y cualquier página de acceso privado no deben indexarse ni rastrearse. Se bloquean en robots.txt Y se protegen con autenticación. La combinación de ambas capas de protección es la práctica correcta.

Páginas de error — Noindex

Las páginas de error (404, 403, 500) no deben indexarse. En un sitio bien configurado, estas páginas devuelven el código HTTP correcto (no un 200 con una página de error, que es el “soft 404”) y los buscadores no las indexan. Pero añadir noindex como capa adicional es una buena práctica.

Landing pages de campaña — Noindex habitualmente

Tratado en detalle en landing pages como tipo de contenido. La regla general es noindex para landing pages temporales de campaña y decisión caso a caso para landing pages permanentes.


La tabla de decisión rápida

Tipo de páginaIndexarRazón
Artículo, producto, curso, glosarioContenido original de valor
Portada, secciones principalesPuntos de entrada con contenido propio
Archivo de categoría (con contenido)Si tiene descripción editorial y volumen suficiente
Archivo de categoría (sin contenido)NoLista sin valor añadido propio
Archivo de etiquetaNo (mayoritariamente)Lista sin narrativa editorial
Páginas de paginaciónNoSubconjunto sin valor diferencial
Resultados de búsqueda internaNoContenido dinámico sin valor propio
Páginas de confirmaciónNoNo son puntos de entrada
Landing pages de campaña temporalNoCiclo de vida ligado a la campaña
Páginas de administraciónNoContenido privado
Páginas de errorNoNo son contenido

Cómo implementar la decisión

La decisión de indexar o no se implementa con la directiva robots en el <head> de la página:

<!-- Para indexar (valor por defecto, no necesario declararlo explícitamente) -->
<meta name="robots" content="index, follow" />

<!-- Para no indexar pero sí seguir los enlaces -->
<meta name="robots" content="noindex, follow" />

<!-- Para no indexar y no seguir los enlaces -->
<meta name="robots" content="noindex, nofollow" />

En WordPress, los plugins de SEO (Yoast, Rank Math, SEOPress) permiten configurar estas directivas a nivel de tipo de contenido (todos los archivos de etiqueta en noindex, por ejemplo) y a nivel de página individual.


La calidad del índice importa

Un sitio con miles de páginas indexadas de bajo valor no es mejor que un sitio con cientos de páginas indexadas de alto valor. La calidad del índice —la proporción de páginas indexadas que son genuinamente útiles para los usuarios— afecta a cómo los buscadores perciben el sitio en su conjunto.

Auditar periódicamente qué está indexado y compararlo con qué debería estar indexado es una tarea de mantenimiento de la arquitectura tan importante como crear contenido nuevo.


Para profundizar