WordPress y las penalizaciones de Google por contenido duplicado

9 enero 2007 - 0:27

Hace semanas que el servicio de Diagnóstico de URL’s de Google Adsense, viene mostrando extraños errores que traen de cabeza a más de uno y que vienen acompañados de más y peores problemas.

El siguiente síntoma extraño suele ser que algunos webs dejan de recibir tráfico de Google por determinadas palabras clave, por las que estaban excepcionalmente indexados ¿que ha sucedido? sigues investigando y resulta que aplicando el “site:www.tudominio.com” en Google, aparecen los Comentarios del Blog, pero no los post o estos quedan relegados a los últimos lugares. Por supuesto, los ingresos por Adsense disminuyen. Es decir, Google cree que tu Blog tiene contenido duplicado.

¿se han vuelto locos? es lo primero que piensas. Si quieres mi opinión te diré, un poco si. Está bien luchar contra el spam y las técnicas sucias de SEO para posicionar y engañar a Google, pero creo que llegar a pensar que la página que lista todos los post de un mes determinado es creada especificamente para engañar y que realmente es contenido duplicado, pero parece ir demasiado lejos.

Lo malo, lo de siempre. Que WordPress es un CMS muy simple y a la vez muy potente y por ello, muy utilizado para bien (publicar contenidos) y para mal (engañar a Google para posicionar) y los chicos de Mountain View han decidido que ha llegado la hora de hacer limpieza y se les ha ido la mano.

He buscado y rebuscado durante horas y apenas he encontrado unos cuantos post fechados en Diciembre hablando del tema (reconozco que me lo he colado, o no le he dado importancia hasta notar las consecuencias), pero … no se ha corrido demasiado la voz y me extraña. Imagino que es; una vez más; causa de que oficialmente no ha quedado claro que es y que no es contenido duplicado.

Bueno, mis conclusiones ahora mismo son las siguientes:

1/ Es muy importante que Google lea solo las urls de los post, las páginas estáticas y como mucho las de cada categoría, además de la Home, claro. Para eso elimina del header del Blog, cualquier referencia del tipo:

La mayor parte de las veces vienen en los themes de WordPress, con lo que me temo que ahora va a haber que tener mucho más cuidado con este tema.

2/ Para ayudarle a discernir que debe y que no debe indexar, introduce estas líneas de código juso después del título en el fichero header.php

< ?php
if((is_home() && ($paged < 2 )) || is_single() || is_page() || is_category()){
echo '‘;
} else {
echo ‘‘;}
 ?>

3/ Por si acaso no se da por aludido, todavía podemos subir un fichero robots.txt al directorio raíz.

User-agent: *
Disallow: /wp-
Disallow: /search
Disallow: /feed
Disallow: /comments/feed
Disallow: /feed/$
Disallow: /*/feed/$
Disallow: /*/feed/rss/$
Disallow: /*/trackback/$
Disallow: /*/*/feed/$
Disallow: /*/*/feed/rss/$
Disallow: /*/*/trackback/$
Disallow: /*/*/*/feed/$
Disallow: /*/*/*/feed/rss/$
Disallow: /*/*/*/trackback/$

4/ Utilización de URL canónicas, es decir o con www o sin ellas, pero nada de utilizar el truco para duplicar el contenido.Para evitarlo puedes incluir este código en un .htaccess en el directorio raíz.

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www.yoursite.com$ [NC]
RewriteRule ^(.*)$ http://www.yoursite.com/$1 [R,L]
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]

Hay más cosas que pueden ser importantes, pero yo ya me pierdo.
Incluso existe un Plugin para evitar contenido duplicado (DupPrevent), que hace lo mismo que comento en el segundo punto y que encima a mi no me funciona y tal y como dice Armonth, prefiero colocarlo directamente en el Theme.

Lo que mejor resume lo que he contado y recoge muy buenas aportaciones está en SeoResearcher .
Nosotros empezaremos a probar todo esto desde ahora mismo y controlaremos los logs, el paso de robots por los blogs, indexación, etc y os iré contando si se solucionan los problemas.

Esperemos que este post no lo tome como duplicado, por colocarlo en las categorías Posicionamiento, Webmasters y WordPress, pero coño, es que realmente corresponde a esas secciones :-)  Si sabes algo más o pruebas algo de esto, estaría bien que nos contaras como te ha ido.

Puedes Hacer un Comentario, o Trackback desde tu web.

5 Comentarios to “WordPress y las penalizaciones de Google por contenido duplicado”

  1. David Carrero Fdez-Baillo says:

    9 enero 2007 - 8:04

    El caso es que evaluando lo que dices, no acabo de ver problemas, quizás tenga más o menos bien optimizadas las páginas, pero por ejemplo, yo no había pensado en pedirle a google que no siga comentarios o trackbacks, se supone que Google sabe lo que son y que hacer con ellos, no creo que eso represente un problema.

    Y luego quitarle acceso al feed me parece una barbaridad, pues BlogSearch.google.com seguro que sigue ese feed, el caso es que estaré un poco más al tanto, pero no he visto mucho problema hasta ahora.

    Sobre la bajada de ingresos de AdSense, yo he vuelto a niveles de antes de Navidad, pero es que la Navidad siempre pega fuerte en toda la publicidad.

  2. Wordpress y las penalizaciones en buscadores por duplicados - carrero Bitácora de los Hermanos Carrero, David Carrero Fernández-Baillo y Jaime Carrero Fernández-Baillo. Todo sobre Internet, Tecnología, Tendendias, Dominios, Bitácoras, Diseño y Progr says:

    9 enero 2007 - 8:42

    [...] Os recomiendo los siguientes artículos relacionados a este tema: Sigt no dice Cómo arreglar el problema del contenido duplicado en WordPress. DupPrevent, Plugin para WordPress para controlar contenido duplicado. Fernando Gómez nos comenta sobre WordPress y las penalizaciones de Google por contenido duplicado. Seo researcher: How to Make a WordPress Blog Duplicate Content Safe. (enlace a cache de Google). Mariano nos habla también de El contenido duplicado en Google. [...]

  3. David Carrero Fdez-Baillo says:

    9 enero 2007 - 8:15

    El enlace a Seo Researcher no está accesible, pero por cache de google si.

  4. oleg.ishenko says:

    12 enero 2007 - 1:28

    “El enlace a Seo Researcher no está accesible, pero por cache de google si.”

    Sorry, the entire Bluehost.com network was down for few hours. It’s Ok now

  5. Google banea a una Cadena hotelera por listos - Fernando Gomez says:

    21 marzo 2007 - 23:40

    [...] meses estudiando como mejorar el posicionamiento y después de muchos sustos y dolores de cabeza, comenzamos a disfrutar de algunos buenos resultados en sites propios y de [...]

Hacer un Comentario