El contenido duplicado en pocas palabras

Contenido duplicado se refiere a un texto muy parecido o exactamente igual que aparece en varias páginas web. Recuerda que:

  • El contenido duplicado tiene poco o ningún valor para tus visitantes y además confunde a los motores de búsqueda.
  • Evita tener contenido duplicado ya que podría perjudicar tu posicionamiento web.
  • La aparición de contenido duplicado puede deberse a errores técnicos y por contenido copiado manualmente.
  • Hay varias maneras de prevenir ambos casos de contenido duplicado que discutiremos a continuación en este artículo.

¿Qué es el contenido duplicado?

Estrictamente, el contenido duplicado se refiere a un texto muy parecido o exactamente igual que aparece en varias páginas dentro de su mismo, u otro, sitio web.

Además, el contenido duplicado tiene poco o ningún valor para tus visitantes, por lo que aquellas páginas con poco o ningún contenido también son consideradas como contenido duplicado.

Deberías evitar tener contenido duplicado ya que puede confundir a motores de búsqueda y perjudicar a tu posicionamiento SEO.

El contenido duplicado confunde a los robots de motores de búsqueda.
El contenido duplicado confunde a los robots de motores de búsqueda.

¿Por qué es el contenido duplicado perjudicial para el SEO?

Hay dos principales razones por las que el contenido duplicado es perjudicial:

  1. Cuando hay varias versiones del contenido disponibles, es difícil para los motores de búsqueda determinar qué versión indexar y mostrar en los resultados. Esto reduce el rendimiento de todas las versiones ya que hay competición entre ellas.
  2. Los motores de búsqueda tendrán problemas para consolidar las métricas de enlaces (autoridad, relevancia y confianza) del contenido, especialmente cuando otros sitios web enlazan a más de una versión de ese contenido.

¿Qué dicen los expertos acerca del contenido duplicado?

Barry Adams
Barry Adams

"El contenido duplicado puede causar serios problemas en SEO y enviar señales conflictivas a los motores de búsqueda. Toma las medidas necesarias para asegurar que tu contenido tiene URLs únicas, de forma que cada página tenga las todas las oportunidades posibles para posicionarse bien y dirigir tráfico hacia tu sitio."

Jenny Halasz
Jenny Halasz

"El contenido duplicado es el problema de SEO más predominante pero menos comprendido. Hay muchas formas de duplicación de contenido por las que te tienes que preocupar, y un pequeño error técnico puede llevar a la aparición de miles de páginas duplicadas. La URL canónica no es siempre la mejor solución, y este artículo de ContentKing hace un gran trabajo identificando el problema y la solución de decenas de problemas comunes de contenido duplicado.

He visto sitios web de mucho éxito afectados por el contenido duplicado. En estos casos, resolver los problemas causantes del contenido duplicado puede resultar en un aumento de hasta el 20% en el tráfico orgánico. Cuando tienes millones de visitantes, esto puede resultar en cientos de milliones adicionales de recaudación."

Omi Sido
Omi Sido

"Cada vez que creas 3 o 4 versiones de una de tus páginas estás compitiendo contigo mismo 3 o 4 veces antes de que tu página empiece a competir con otras en las páginas de resultados del buscador."

Paul Shapiro
Paul Shapiro

"La gente normalmente tiene una idea equivocada del contenido duplicado. Si me diesen 20 céntimos cada vez que he oido a un experto del SEO decir que con contenido duplicado te ganas una penalización de Google Panda, tendría por lo menos 50 euros. Es una broma. Pequeña industria.

En cualquier caso, si tienes una o dos páginas menos importantes con contenido duplicado, realmente no hay por qué preocuparse. Los problemas de verdad aparecen cuando tu propio sitio web está generando gran cantidad de contenido duplicado a causa de un desarrollo pobre de la web y problemas técnicos de SEO. Esto puede derivar en complicaciones en el rastreo y problemas de tráfico. El contenido duplicado también es preocupante si otro dominio se está apropiando de tu contenido y esas páginas superan a la tuya en los rankings. Esto ocurre poco frecuentemente, ¡pero puede pasar!

Por último, probablemente el mayor problema con el contenido duplicado es la dilución de enlaces. Si tengo 2 versiones de la misma página, y los usuarios no saben cuál es la "principal" es posible que una reciba enlaces y la otra no. De esta manera, en lugar de tener una página con todos los enlaces, estos se reparten entre las dos páginas. No bueno."

Bas van den Beld
Bas van den Beld

Es fácil caer en la trampa del contenido duplicado, principalmente porque la mayor parte de las organizaciones casi nunca piensan en su estrategia de contenido.

Tienes que entender qué estás haciendo y cómo "controlarlo" Si no, es posible que estés yendo a 90 en una carretera en la que deberías ir a 50, pero nadie te lo dijo. Duele aunque no lo supieras.

¡Ten cuidado con esto!

Patrick Stox
Patrick Stox

¿Sabías qué el 25-30% de una web es contenido duplicado? ¡Pero no pasa nada! No vas a recibir una penalización, y aunque creo firmemente que deberías especificar cómo tratar las duplicaciones, si no haces nada Google tiene muchas maneras de intentar resolver estos problemas por tí. No le daría demasiada importancia, a no ser que estés haciendo algo que podría acarrear problemas graves, como tomar contenido de otros sitios web.

Hamlet Batista
Hamlet Batista

Consolidar contenido duplicado no consiste en evitar las penalizaciones de Google. Se trata de construir enlaces. Los enlaces son importantes para en rendimiento en el SEO, pero si los enlaces acaban en páginas duplicadas, no sólo no te ayudan, sino que son desperdiciados.

David Iwanow
David Iwanow

El contenido duplicado es un problema enorme para plataformas heredadas que están configuradas para depender de parámetros para la estructura interna de la página. El contenido duplicado también es un problema para las plataformas más nuevas como WordPress con páginas /tag/ que son normalmente NoIndexed desde el principio.

El contenido duplicado puede darse también con una configuración pobre de la infraestructura de hosting que hace posible tener URLs sensibles a mayúsculas y minúsculas que generan literalmente millones de páginas de contenido duplicado, que puede agravarse con el uso de mayúscuals y minúsculas en enlaces internos. Google Search Console ofrece gestión de parámetros de URL para reducir el contenido duplicado creado mediante parámetros. El contenido duplicado es también muy común en sitios de eCommerce que tienen un mismo producto en varias categorías, o productos muy similares con sólo ligeras variaciones como "calcetines color azul" y "calcetines color azul oscuro".

Los sitios más grandes normalmente tienen muchas plantillas, el problema es que estas páginas no suelen recibir tráfico porque Google es suficientemente inteligente como para entender que es el mismo contenido. El mayor problema de contenido duplicado se puede dar si Google entiende mal el contenido y recibes visitantes en las páginas erróneas. Esto ya se dió en el pasado con un cliente porque Google no pudo entender la diferencia entre Londres, UK y Londres, Ontario (Canadá) ya que el contenido era 85-90% similar.

Un problema para muchos SEOs es que no usan los datos analíticos de los sitios web para entender cuánto tráfico va destinado a su contenido duplicado. Tienes que asegurarte de no acabar con el contenido duplicado muy drásticamente a no ser que vaya a haber poco impacto en el tráfico, según los datos analíticos.

¿Existe contenido duplicado en tu sitio web?

Es posible que el contenido duplicado esté perjudicando a tu rendimiento en SEO. ¿Por qué no comprobar si en tu sitio web hay contenido duplicado?

Ponga un nombre de dominio válido, por favor (www.ejemplo.es).

¿Hay penalización por el contenido duplicado?

Tener contenido duplicado puede afectar a tu rendimiento SEO, pero no hará que Google te penalice siempre que no hayas copiado otra web de manera intencionada. Siempre y cuando seas un propietario honesto que simplemente se enfrenta a algunos desafíos técnicos pero no intenta engañar a Google, no tendrás que preocuparte por recibir una penalización.

En el caso de que hayas copiado una gran cantidad de contenido ajeno puede que estés en la cuerda floja. Esto es lo que Google dice al respecto:

“El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si tu sitio tiene problemas relacionados con contenido duplicado y no sigues los consejos indicados anteriormente, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.”

Principales causas de contenido duplicado

El contenido duplicado es comúnmente causado por un servidor o sitio web configurado de forma incorrecta. Estas incidencias de origen técnico rara vez son penalizadas por Google. Sin embargo, pueden perjudicar seriamente tu posición en rankings, por lo que es prioritario resolverlas.

Aparte de las causas de origen técnico, también hay incidencias desencadenadas por los usuarios: contenidos que son intencionadamente copiados y publicados desde otra página. Como hemos dicho, estas acciones pueden conllevar penalización.

Contenido duplicado debido a razones técnicas

No-www vs www y HTTP vs HTTPs
Digamos que estás usando el subdominio www y HTTPs. Entonces la forma ideal de presentar tu contenido sería usar https://www.ejemplo.es. Este sería tu dominio canónico.

Si tu servidor web está configurado de manera incorrecta, tu contenido también podría ser accesible mediante:

Contenido duplicado debido a diferentes dominios canónicos.
Contenido duplicado debido a diferentes dominios canónicos.

Elige una forma preferida de proporcionar tu contenido y pon en marcha algunas redirecciones tipo 301 para las no preferidas que llevan a la versión preferida: https://www.ejemplo.es.

Estructura de la URL: mayúsculas/minúsculas y barra final
Las URLs dependen de mayúsculas y minúsculas, de forma que https://ejemplo.es/url-a/ y https://ejemplo.es/url-A/ son percibidas como diferentes URLs. Al crear enlaces es fácil cometer erratas, lo que causaría la indexación de ambas URLs.

La barra diagonal (/) al final de una URL se denomina barra final. A menudo las URLs son accesibles desde ambas variantes: https://ejemplo.es/url-a y https://ejemplo.es/url-a/.

Contenido duplicado debido a incoherencias en el uso de minúsculas y mayúsculas y barra final en la URL.
Contenido duplicado debido a incoherencias en el uso de minúsculas y mayúsculas y barra final en la URL.

Elige una estructura preferida para tu URL y para las no-preferidas pon en marcha una redirección de tipo 301 a la versión preferida.

Páginas de índice(index.html, index.php)
Es posible que tu página principal sea accesible a partir de múltiples URLs sin tu conocimiento debido a una mala configuración de tu servidor web. Aparte de mediante https://www.ejemplo.com, es posible que tu página principal también sea accesible a través de:

  • https://www.ejemplo.es/index.html
  • https://www.ejemplo.es/index.asp
  • https://www.ejemplo.es/index.aspx
  • https://www.ejemplo.es/index.php

Elige una estructura preferida para tu URL y para las no-preferidas pon en marcha una redirección de tipo 301 a la versión preferida.

Parámetros de filtrado
Los sitios web a menudo utilizan parámetros en URLs de forma que puedan ofrecer la función de filtrado. Tomando la siguiente URL como ejemplo:

https://www.ejemplo.com/juguetes/coches?color=negro

Esta página mostraría todos los coches de juguete negros.

Mientras que esto está bien para los visitantes, también puede ser un serio problema para motores de búsqueda. Las opciones de filtrado normalmente generan combinaciones virtualmente infinitas cuando hay más de una opción de filtrado disponible, Sobre todo cuando los parámetros también se pueden ajustar.

Estas dos URLs deberían mostrar exactamente el mismo contenido:

Contenido duplicado debido a diferencias en el orden de los parámetros de la URL.
Contenido duplicado debido a diferencias en el orden de los parámetros de la URL.

Utiliza URLs canónicas, una para cada página principal sin filtrar, para prevenir contenido duplicado y consolidar la autoridad de las páginas derivadas de la filtración.

Taxonomías
Una taxonomía es un mecanismo de agrupación para calificar contenidos. Se utilizan comúnmente en Sistemas de Gestión de Contenidos para crear categorías y etiquetas.

Digamos que tienes un blog en tres categorías. El blog sería accesible mediante las tres:

  • https://www.ejemplo.com/categoria-a/tema/
  • https://www.ejemplo.com/categoria-b/tema/
  • https://www.ejemplo.com/categoria-c/tema/
Contenido duplicado debido a que una página aparece en varias categorías.
Contenido duplicado debido a que una página aparece en varias categorías.

Asegúrate de elegir una de estas categorías como la principal y haz que las otras canonicalicen a la principal usando la URL canónica.

Páginas destinadas a imágenes
Algunos Sistemas de Gestión de Contenidos crean una página diferente para cada imagen. Esta página normalmente muestra solo la imagen. Como estas páginas no tienen ningún otro contenido, se parecen mucho entre sí por lo que contribuyen al contenido duplicado.

Utiliza una URL canónica en estas páginas destinadas a imágenes que las dirija a la página en la que la imagen fue usada.

Páginas de comentarios
Si tienes los comentarios habilitados en tu sitio web puede que los comiences a paginar tras un determinado tiempo. Las páginas de estos comentarios paginados mostrarán el contenido original mientras que solo los comentarios del final serán diferentes.

Por ejemplo, la URL de la página que muestra los comentarios 1-20 podría ser: https://ejemplo.com/categoria/tema/, mientras que aquella para los comentarios 21-40 sería https://www.ejemplo.com/categoria/tema/comentarios-2/, y para los comentarios 41-60 sería https://www.ejemplo.com/categoria/tema/comentarios-3/.

Utiliza relaciones de enlaces de paginación para señalizar que estas son series de páginas paginadas.

Localización
Cuando se trata de localización, problemas de contenido duplicado pueden aparecer cuando utilizas exactamente el mismo contenido para dirigirte a población de diferentes regiones que hablan el mismo idioma. Por ejemplo, cuando tienes un sitio web dedicado al mercado de España , y otro dedicado al mercado de Argentina, ambos en español, es probable que tengas mucho contenido duplicado.

Utiliza relaciones de enlaces de hreflang para señalar que las páginas localizadas están destinadas a diferentes públicos.

Páginas de resultados de búsqueda indexables
Muchos sitios web permiten la búsqueda dentro del mismo sitio web. Las páginas en las que se muestran los resultados de búsqueda son muy similares entre sí, y en la mayoría de los casos no les proporcionan ningún valor a los motores de búsqueda. Por lo tanto, no quieres que estas sean indexadas por motores de búsqueda.

Evita la indexación de las páginas de resultados de búsqueda utilizando la metaetiqueta noindex. En general, la mejor práctica es no enlazar a tus páginas de resultados de búsqueda.

Entornos de ensayo indexables 
De la misma forma, es una buena opción hacer staging de tu web para desarrollar y probar nuevas funciones. Sin embargo, estos sitios web en etapa de desarrollo son accesibles y por lo tanto indexables por motores de búsqueda.

Contenido duplicado debido a la presencia de múltiples webs a disposición pública.
Contenido duplicado debido a la presencia de múltiples webs a disposición pública.

Utiliza autenticación HTTP para prevenir el acceso a los sitios web que se encuentran en etapa de desarrollo. Además, así evitas también que la gente equivocada pueda acceder.

Evita publicar contenido en desarrollo
Cuando crees una página con poco contenido guárdala sin publicarla, ya que normalmente proporciona poco o ningún valor.

Guarda la página sin acabar como borrador. Si necesitas publicar páginas con contenido limitado, evita que los motores de búsqueda las indexen utilizando metaetiquetas robot noindex.

Parámetros de rastreo
Algunos parámetros son usados comúnmente para rastreo. Por ejemplo, cuando compartes URLs en Twitter, la fuente se añade a la URL. Esto es otra fuente de contenido duplicado. Tomemos como ejemplo esta URL que fue twitteada usando Buffer:

https://www.contentkingapp.com/academy/ecommerce-link-building/?utm_content=buffer825f4&utm_medium=social&utm_source=twitter.com&utm_campaign=buffer

Es una buena práctica utilizar URLs canónicas autoreferenciadas en las páginas. Si ya has hecho esto, el problema está resuelto. Todas las URLs con estos parámetros de rastreo son canonicalizadas por defecto a la versión sin parámetros.

ID de sesión
Las sesiones pueden almacenar información del visitante para los análisis de la propia web. Si cada URL que el visitante solicita añade un ID de sesión, se crea una gran cantidad de contenido duplicado, ya que el contenido de estas URLs es exactamente el mismo.

Por ejemplo, cuando haces clic en una versión localizada de nuestro sitio web, añadimos una sesión de Google Analytics como https://www.contentking.nl/?_ga=2.41368868.703611965.1506241071-1067501800.1494424269.Muestra la página principal con exactamente el mismo contenido pero en una URL diferente.

Una vez más, sería buena idea utilizar URLs canónicas autoreferenciadas en las páginas. Si ya has hecho esto, el problema está resuelto. Todas las URLs con estos parámetros de rastreo son canonicalizadas por defecto a la versión sin parámetros.

Versión imprimible
Cuando una página tiene una versión imprimible con una URL diferente, aparecen dos versiones con el mismo contenido. Por ejemplo: https://www.ejemplo.es/una-página/ y https://www.ejemplo.es/imprimir/una-página/.

Utiliza una URL canónica que lleve desde la versión imprimible a la versión normal de la página.

Contenido duplicado causado por contenido copiado

Páginas de aterrizaje para búsquedas de pago
Las búsquedas de pago requieren páginas de aterrizaje dirigidas a palabras clave específicas. Las páginas de aterrizaje son normalmente copias de las páginas originales que han sido modificadas para atender a estas palabras específicas. Dado que estas páginas son muy parecidas, producen contenido duplicado cuando son indexadas por los motores de búsqueda.

Contenido duplicado debido a pequeñas diferencias entre las páginas de aterrizaje.
Contenido duplicado debido a pequeñas diferencias entre las páginas de aterrizaje.

Evita que los motores de búsqueda indexen las páginas de aterrizaje utilizando metaetiquetas robots noindex. En general sería una buena idea no enlazar tus páginas de aterrizaje, ni incluirlas en tu mapa de sitio XML.

Tu contenido copiado por otros
Contenido duplicado también aparece cuando otros copian tu contenido y lo publican en otro lugar. Esto es un problema aún mayor si tu sitio web tiene un dominio de baja autoridad, y el del que copia tu contenido es de mayor autoridad ya que puede ser percibido como el autor original y sobrepasarte en el posicionamiento.

Asegúrate de que otros sitios web te den crédito al utilizar una URL canónica que enlace y dirija a tu página. Si no estuviesen dispuestos a hacerlo, podrías enviar una solicitud a Google basada en la DMCA, y/o tomar acciones legales

Encontrar contenido duplicado

Encontrar contenido duplicado en tu sitio web

Utilizando ContentKing, puedes encontrar fácilmente contenido duplicado comprobando si tus páginas tienen un título, meta descripción y encabezado H1 únicos. Puedes hacerlo accediendo a la sección Problemas y abriendo Metadatos y comprobando que no hay problemas como:

  • “El título de la página no es único”
  • “La meta descripción no es única”
  • “El título H1 no es único”

Revisa rápidamente tu sitio web en busca de contenido duplicado

Con ContentKing puedes comprobar fácilmente si tu sitio web tiene problemas de contenido duplicado. Estará listo en sólo 20 segundos.

Ponga un nombre de dominio válido, por favor (www.ejemplo.es).

Encontrar contenido duplicado fuera de tu sitio web

Si tienes un sitio web pequeño puedes intentar buscar en google determinadas frases entre comillas. Por ejemplo, si quisieras ver si hay alguna otra versión de este artículo, podrías buscar “Utilizando ContentKing, puedes encontrar fácilmente contenido duplicado comprobando si tus páginas tienen un título, meta descripción y título H1 únicos”.

Sin embargo, para sitios web más grandes, puedes utilizar un servicio como Copyscape. Copyscape registra la web en busca de múltiples casos de contenido igual o similar.

Preguntas más frecuentes acerca del contenido duplicado

  1. ¿Puedo ser penalizado por tener contenido duplicado?
  2. ¿Arreglar mi contenido duplicado mejorará mi posicionamiento en los rankings?
  3. ¿Cuánto contenido duplicado es aceptable?

1. ¿Puedo ser penalizado por tener contenido duplicado?

Si no has copiado el sitio web de otra persona de forma intencionada, es muy poco probable que seas penalizado debido a tener contenido duplicado. Si, por el contrario, has copiado grandes cantidades del contenido de otra persona es posible que estés en la cuerda floja. Esto es lo que dice Google al respecto:

“El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si tu sitio tiene problemas relacionados con contenido duplicado y no sigues los consejos indicados anteriormente, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.”

2. ¿Arreglar mi contenido duplicado mejorará mi posicionamiento en los rankings?

Sí, ya que al resolver los problemas de contenido duplicado le estás diciendo a los motores de búsqueda qué páginas deberían estar rastreando, indexando y añadiendo a los rankings.

Además, estarías evitando que los motores de búsqueda amplíen su crawl budget a páginas duplicadas e irrelevantes, de forma que puedan centrarse en el contenido único del sitio web con el que quieres posicionarte en los rankings.

3. ¿Cuánto contenido duplicado es aceptable?

Lo cierto es que no hay una buena respuesta para esta pregunta. Sin embargo, si quieres posicionarte bien en los rankings con una página, esta tendrá que ser valorada por tus visitantes y tener contenido único.

Aprenda más sobre  Contenido Duplicado

Si quieres seguir leyendo acerca de Contenido Duplicado, te recomendamos que eches un vistazo a los siguientes artículos:

Comenzar tus 14 días de prueba gratuita

Comience en tan solo 20 segundos

Ponga un nombre de dominio válido, por favor (www.ejemplo.es).
  • No se requiere ninguna tarjeta de crêdito
  • No hay que instalar nada
  • Sin compromiso