Definición: Marcas semánticas que se añaden al código HTML de una página para proporcionar contexto explícito sobre el contenido, permitiendo que los buscadores y otras aplicaciones lo interpreten con mayor precisión.
Vocabulario principal: Schema.org, desarrollado conjuntamente por Google, Bing, Yahoo y Yandex. Define un vocabulario común de tipos de entidades (Article, Product, Event, Person, BreadcrumbList, FAQPage…) y sus propiedades.
Formatos de implementación:
- JSON-LD (recomendado): bloque JavaScript en el
<head>o al final del<body>. Separado del HTML visible, fácil de mantener. - Microdata: atributos HTML dentro del marcado del contenido. Más invasivo, más difícil de mantener.
- RDFa: similar a Microdata, usado en contextos más académicos o institucionales.
Ejemplo JSON-LD para un artículo:
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Qué es la Arquitectura de la Información",
"author": {
"@type": "Person",
"name": "Nombre del autor"
},
"datePublished": "2024-11-01"
}
Relación con AI: Los datos estructurados son la capa que conecta la arquitectura de la información con la web semántica. Permiten que la estructura conceptual del sitio (tipos de contenido, relaciones entre entidades, jerarquías) sea comprensible no solo para los usuarios sino para las máquinas.
Relacionado con: Ontología, breadcrumb, indexación.