- El espectro del contenido multiidioma
- ¿Es la traducción contenido duplicado?
- El problema del contenido copiado entre versiones del mismo idioma
- Traducción automática: riesgos arquitectónicos
- Contenido exclusivo por mercado: una oportunidad infrautilizada
- Gestión del contenido sin traducción
- Para profundizar
Uno de los malentendidos más frecuentes en la internacionalización web es tratar toda versión idiomática de un contenido como contenido duplicado. No lo es, o no necesariamente. La diferencia entre una traducción, una adaptación y contenido original en otro idioma tiene consecuencias directas en cómo se estructura el sitio, cómo se configura la indexación y qué señales se envían a los buscadores.
El espectro del contenido multiidioma
El contenido multiidioma no es una categoría homogénea. Existe un espectro que va desde la traducción literal hasta el contenido completamente original en otro idioma:
Traducción literal: El mismo contenido, palabra por palabra, en otro idioma. El mensaje, los ejemplos, las referencias culturales son idénticos. Solo cambia el idioma.
Traducción adaptada: El contenido base es el mismo, pero se adaptan referencias culturales, ejemplos, unidades de medida, monedas, fechas y expresiones idiomáticas para que resulten naturales en el idioma de destino.
Localización: Más allá de la adaptación lingüística, se modifica el contenido para reflejar las especificidades del mercado local: precios en moneda local, referencias a la legislación local, casos de uso relevantes para ese mercado, testimonios de clientes locales.
Contenido original por mercado: Contenido creado específicamente para un mercado en su idioma, sin una versión equivalente en otros idiomas. No es una traducción de nada: es contenido propio de ese mercado.
¿Es la traducción contenido duplicado?
Desde el punto de vista técnico de los buscadores, un texto en español y su traducción al alemán son contenidos distintos. Los buscadores indexan cada idioma de forma independiente: la versión española compite en búsquedas en español; la versión alemana, en búsquedas en alemán. No hay duplicación real a ojos del buscador porque los usuarios que ven cada versión son distintos y las consultas que las activan son distintas.
El contenido duplicado problemático ocurre cuando el mismo contenido en el mismo idioma es accesible desde múltiples URLs. Dos páginas en español con el mismo texto son contenido duplicado. Una página en español y su traducción al alemán no lo son.
Sin embargo, hay un caso en que la traducción sí puede percibirse como duplicada: cuando el contenido es tan genérico que es prácticamente idéntico entre mercados aunque esté en idiomas distintos. Páginas de contacto, páginas de política de privacidad, páginas de error… Si el contenido de estas páginas es idéntico en todos los mercados (mismo texto, mismo diseño, misma información), implementar hreflang entre ellas es discutible. Lo razonable es tener una sola versión por idioma, no por mercado.
El problema del contenido copiado entre versiones del mismo idioma
El caso problemático real en la internacionalización no es la traducción entre idiomas, sino la copia de contenido entre versiones del mismo idioma para distintos mercados.
Ejemplo: Un sitio tiene una versión para España (/es-es/) y una versión para México (/es-mx/). Si el 95% del contenido es idéntico —mismo texto en español, mismas imágenes, misma descripción de productos— y solo difieren el precio y el número de teléfono de contacto, los buscadores sí pueden percibir ese contenido como duplicado.
Las soluciones en este caso:
Canonical de la versión específica a la versión genérica: La versión para México (/es-mx/articulo/) tiene un canonical a la versión genérica en español (/es/articulo/). La versión genérica es la que se indexa; las versiones por país son variantes que los buscadores conocen pero no indexan como contenido independiente.
Diferenciación real del contenido: Invertir en crear contenido genuinamente distinto para cada mercado. Si la versión mexicana tiene casos de uso mexicanos, referencias al mercado local, terminología local y ejemplos relevantes para ese contexto, ya no es contenido duplicado.
Noindex en versiones de bajo valor diferencial: Si la versión para un mercado específico no tiene suficiente contenido diferenciado para justificar su indexación independiente, ponerla en noindex y usar hreflang solo como señal de destino para usuarios de ese mercado.
Traducción automática: riesgos arquitectónicos
La traducción automática (machine translation) ha mejorado enormemente con los modelos de lenguaje modernos, pero sigue presentando riesgos desde el punto de vista de la arquitectura de la información:
Volumen sin calidad: La traducción automática permite publicar contenido en decenas de idiomas de forma inmediata. El resultado puede ser un sitio con miles de páginas en idiomas que nadie en la organización puede revisar, con errores de traducción, con texto no natural y con contenido que no sirve realmente a los usuarios de esos mercados.
Penalización por contenido de baja calidad: Los buscadores valoran el contenido útil para el usuario. Una traducción automática de baja calidad puede ser peor que no tener versión en ese idioma.
Recomendación: Traducir automáticamente con revisión humana posterior. Priorizar los idiomas más importantes para el negocio y traducir bien esos, antes que traducir mediocrely a todos los idiomas posibles.
Contenido exclusivo por mercado: una oportunidad infrautilizada
La mayoría de sitios multiidioma se limita a traducir el contenido existente. Pocos aprovechan la oportunidad de crear contenido original específico para cada mercado.
Ese contenido original puede ser:
- Guías sobre la legislación local relevante para el sector.
- Casos de estudio con clientes locales.
- Análisis del mercado local.
- Contenido sobre festividades, eventos o contextos culturales locales.
Este contenido no tiene versión en otros idiomas porque no tiene sentido en otros mercados. No necesita hreflang. No genera duplicados. Y puede ser extremadamente valioso para los usuarios de ese mercado.
Gestión del contenido sin traducción
No todo el contenido de un sitio necesita traducirse a todos los idiomas. Gestionar qué se traduce y qué no es una decisión arquitectónica:
Contenido siempre traducido: portada, secciones principales, contenido de producto, páginas de conversión.
Contenido selectivamente traducido: artículos del blog (traducir los más importantes, dejar en el idioma original los más específicos o los de menor tráfico esperado en otros mercados).
Contenido no traducido: notas de prensa muy locales, contenido para audiencias muy específicas, documentación técnica muy detallada donde la audiencia puede leer en el idioma original.
Cuando un contenido no está disponible en el idioma del usuario, hay dos opciones: mostrar la versión en el idioma disponible (con indicación clara de que no hay versión en su idioma) o no mostrar el contenido en absoluto. La primera opción es generalmente mejor: el usuario decide si quiere acceder al contenido en otro idioma.