El contenido duplicado es un problema muy común, los buscadores, en especial Google, utilizan robots (bots) especiales para rastrear las páginas y las indexan en base a la relevancia de la información que ofrecen. Los algoritmos de los buscadores se han perfeccionado para detectar el contenido duplicado.
Si tu página tiene este tipo de contenido puede quedar afectada de cara a la posición de los buscadores.
Piensa que los buscadores han sido programados para no mostrar el contenido dos veces. Si tu página tiene contenido duplicado, podría no aparecer en el buscador, o aparecer en una posición muy baja que prácticamente hará que sea invisible de cara al visitante.
En este artículo vamos a analizar que es el contenido duplicado en detalle y cómo evitarlo.
¿A qué llamamos contenido duplicado?
El contenido duplicado es aquel contenido ya existente al que se puede acceder a través de un término de búsqueda o frase. Por ejemplo, si copias el primer párrafo de este artículo y los escribes en Google (lo pones entre comillas para que sea más fácil de encontrar), debería de aparecerte este mismo texto. Si otro webmaster lo hubiera copiado, probablemente también aparecería en los resultados.
Sin embargo también hay otras causas que podrían producir este contenido.
Causas más habituales del contenido duplicado
Gestión incorrecta de las URLs: ¿Sabías que puedes tener contenido duplicado dentro de tu propia web? Esto es debido a una incorrecta gestión de las URLs, probablemente por el sistema de plantillas que utilizas. Aunque pueda parecer una tontería, es posible que esto esté penalizando tu web, evitando que ascienda a las primeras posiciones del buscador.
Id de sesión: Existen algunos sitios que gestionan las sesiones del usuario añadiendo un código al final de la URL de las páginas. Estos parámetros son diferentes para cada usuario y esto precisamente es lo que podría hacer que el buscador piense que son páginas diferentes, aunque hacen referencia a la misma URL.
Contenido dinámico: Este problema es similar al anterior; hay algunos sitios web que asignan parámetros a las URLs para poder controlar así el contenido que se muestra. De la misma manera que ocurre con las IDs, los buscadores también podrían pensar que estas páginas con copias.
Versión para dispositivos móviles: Google valora muy positivamente las plataformas que tienen versiones especiales para dispositivos móviles, pero esto a veces puede producir más de un problema. Podría ser que se haya generado una URL independiente para un subdominio o subdirectorio, haciendo que el buscador tenga problemas para identificar que, efectivamente, se trata de otra versión.
Comentarios: La forma de paginar de algunos CMS, en especial de Wordpress, puede hacer que el contenido se duplique en ciertas páginas y esto podría derivar en un problema de contenido duplicado.
Copiando contenido: Algunos falsos redactores no tienen reparos en copiar directamente ciertas frases de un determinado texto. Otros utilizan la técnica del spineo, que consiste en coger las mismas frases pero cambiar algunas palabras. Aunque a veces puede funcionar, Google puede detectar este tipo de comportamiento y considerarlo como contenido duplicado.
¿Cómo saber si nuestra web tiene contenido duplicado?
Usando Google Search Console
Google Search Console (o Herramientas para Webmaster) es una completa herramienta que nos permite conocer cualquier problema relacionado con nuestra web. Y si, también nos permite saber si hay contenido duplicado.
Para saberlo habrá que acceder a Apariencia de búsqueda – Mejoras de HTML.
En esta sección podremos conocer si hay meta-descripciones o títulos duplicados, textos enteros, si la longitud de algunos apartados no es la correcta, etc.
Búsqueda manual
Aunque Google Search Console es una herramienta bastante efectiva, no siempre te mostrará todo el contenido duplicado que existe. Por ello, siempre tenemos la opción de hacer una búsqueda manual.
Con la sintaxis: Sitio: ejemplo.com intitle: keyword podremos buscar todas las URLs de nuestro sitio web que tienen la palabra clave en cuestión.
También podemos buscar una larga frase en Google y verificar si en los resultados de búsqueda aparece más de una vez.
Herramientas de detección
Ciertas herramientas como Plagium o Plagiarism Checker nos permiten comprobar si un texto está o no duplicado antes de publicarlo en nuestra web.
Resulta muy práctico para comprobar textos que hemos encargado a un redactor web, o que hemos hecho nosotros mismos y así evaluar el % de frases duplicadas que pueden existir.
¿Cómo podemos evitar el contenido duplicado?
¿Tienes contenido duplicado en tu web? Ponte a trabajar cuanto antes para evitar penalizaciones. Sigue estos consejos y podrás evitarlo:
- Etiqueta rel Canonical: Con la etiqueta rel=canonical puedes indicar a los buscadores cuál es el contenido auténtico, lo que evitará que los bots se confundan a la hora de posicionarlo. Esta etiqueta se puede incluir dentro de la sección, aunque también se podría incorporar dentro de la cabecera HTTP.
- Redirecciones 301: Se recomienda utilizar una redirección 301 cuando no se puede usar la etiqueta anterior, cuando hemos migrado el contenido de una página a otra, entre otros supuestos. Estas redirecciones deben de ser definidas en el archivo .htaccess.
- Restricción del acceso de los robots: También puedes editar el archivo robots.txt (ubicando en la carpeta raíz de tu servidor), para establecer ciertas directrices que indiquen a los bots que páginas no desean indexar. Es importante saber lo que se está haciendo y es que podríamos llegar a restringir páginas que sí que se tendrían que indexar.
- Herramienta de rastreo de “Webmaster Tools”: A través de esta herramienta(que podemos encontrar en Rastreo->Parámetros de URL, tendremos el poder de indicar a Google ciertas páginas a ignorar.
- Unificación de contenidos: Cuando hay varias páginas en tu web que muestran contenido parecido es importante encontrar una fórmula para unificarlas. Podemos crear un gran artículo con todo el contenido, o distribuirlos en artículos más pequeños y enlazarlo todo.
- Agrega sólo contenido de calidad: Y por supuesto, tan sólo integra contenido de calidad, nada de copiar y pegar frases. Antes de contratar a un redactor web asegúrate de que sus contenidos son de calidad y que no copia nada.
Con estas pautas te podrás enfrentar al contenido duplicado.
Otros artículos que te pueden interesar
Rastreabilidad Web ¿Qué es y cómo funciona?
SEO ¿Qué es y por qué es tan necesario para tu empresa?
Redactar contenido para tu página web o blog
Estructura Web perfecta, planificación y factores clave
Estrategia SEO de contenidos ¿Cómo medir su efectividad?
Estudio de palabras Clave relevantes para SEO
Palabras clave para tu web ¿Cómo descubrirlas?