Definición: Archivo o página que lista los contenidos de un sitio web con el objetivo de facilitar su descubrimiento y navegación. Existen dos tipos con funciones distintas: el sitemap XML (para buscadores) y el sitemap HTML (para usuarios).
Sitemap XML: Archivo en formato XML que lista las URLs del sitio con metadatos opcionales (fecha de última modificación, frecuencia de cambio, prioridad relativa). Su función es ayudar a los buscadores a descubrir y rastrear el contenido del sitio, especialmente en sitios grandes o con contenido difícilmente alcanzable desde la navegación normal.
Ejemplo de entrada en sitemap XML:
<url>
<loc>https://www.arquitecturadelainformacion.es/glosario/sitemap/</loc>
<lastmod>2024-11-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
Qué incluir en el sitemap XML: Solo URLs indexables con contenido de valor. No incluir: páginas con noindex, páginas de administración, URLs con parámetros, páginas de paginación (habitualmente), URLs que tienen canonical a otra URL.
Sitemap HTML: Página del sitio web que presenta de forma estructurada y navegable el mapa completo del sitio. Era más relevante antes de que los buscadores fueran capaces de rastrear sitios complejos. Hoy tiene valor principalmente para usuarios, no para buscadores.
Sitemaps de índice: En sitios grandes, un archivo de índice agrupa múltiples sitemaps. Útil cuando hay más de 50.000 URLs o cuando conviene separar sitemaps por tipo de contenido (páginas, artículos, productos, imágenes).
Relacionado con: Indexación, robots.txt, rastreo.