Programación Web y SEO, Ingeniero Industrial

Cómo eliminar los ?replytocom que aparecen en Google Webmasters Tools

Fuentes:

http://abrahamlaria.com/contenidos-duplicados-en-wordpress/

How To Fix Replytocom Links Issue in WordPress [Updated]

Artículo

En este artículo voy a exponer  otro de los problemas de WordPress, en este caso relacionado con la creación automática de contenidos duplicados.

Si tu sitio web ha sido penalizado por Google Panda es posible que uno de los factores que influyeran sea el que te comento hoy. Según he podido investigar varios blogs reconocidos que fueron afectados por Panda recuperaron sus niveles de tráfico tras resolver este problema de duplicidad de contenidos.

El problema de los enlaces ?replytocom.

¿De qué se trata todo esto? Pues bien WordPress genera una página adicional por cada nuevo comentario en uno de tus artículos.

¿Y que contiene esa nueva página? Muy simple, el mismo artículo y los comentarios previos más el nuevo.

¿Cuán grave es el problema? Bastante grave. Imagina que escribes un post X y que recibe 5 comentarios. Pues ya tienes 6 páginas con el mismo artículo repetido, la original más otra por cada uno de los comentarios. Imagina ahora que ese artículo en vez de 5 comentarios recibe 50…

¿Qué formato tienen estas páginas? http://tudominio.com/postX/?replytocom=UnNumeroAleatorio

Contenidos duplicados en WordPress

Contenidos duplicados

 

¿Pero dónde están, yo no las veo ? Ni las verás, WordPress funciona usando una base de datos. Las páginas no existen físicamente sino que se crean de forma dinámica al ser solicitadas por un navegador web.

Todo problema tiene solución.

Aquí hay tres posibles escenarios:

  1. Google ha indexado tus páginas ?replytocom y te ha penalizado.
  2. Google las ha indexado pero aun no te ha penalizado.
  3. Google aun no las ha indexado.

En los dos primeros casos te conviene actuar para des indexar esas páginas y prevenir que vuelvan a ser indexadas. En el tercero, obviamente, te conviene prevenir que puedan ser indexadas.

¿Cómo se hace?

La solución es muy fácil, usar Google Webmaster Tools, Robots.txt y/o el plugin WordPress SEO by Yoast (no obligatorio).

Primero lo primero.

Necesitas saber si Google te ha indexado alguna de estas páginas. Para esto solo tienes que abrir el buscador y escribir lo siguiente:

site:tudominio.com replytocom

Google solo ha indexado una de mis páginas:

Abraham Laria ?replytocom

Abraham Laria ?replytocom

 

Por lo tanto para ilustrar mejor este artículo he decidido tomar como ejemplo el blog de Frank Scipion: lifestylealcuadrado.com. Este es uno de los mejores blogs sobre marketing online en español y Franck, aunque no le conozco personalmente, es alguien a quien admiro y me sirve de inspiración.

Primer paso:

ingresosalcuadrado replytocom

ingresosalcuadrado replytocom

 

Segundo paso:

ingresosalcuadrado ?replytocom

ingresosalcuadrado ?replytocom

 

Si al realizar la búsqueda Google no devuelve resultados para tu sitio estás de suerte. Solo te toca prevenir.

Usando Google Webmaster Tools.

Básicamente lo que haremos aquí es decirle a Google que comience a des indexar las páginas ?replytocom que ha indexado. No es un proceso inmediato puede durar semanas e incluso algunos meses dependiendo de la cantidad de urls indexadas.  En algunos casos no se des indexan todas las páginas, puede que queden unas pocas.

Asumiendo que ya has dado de alta tu sitio en  Google Webmaster Tools ve a con “Configuración” y selecciona “Parámetros de URL”. Si aparece la variable ?replytocom haz click en editar. Ver siguiente imagen.

Google Webmaster Tools

Google Webmaster Tools

 

y luego seleccionar como en la próxima imagen:

 

replytocom nourl

replytocom nourl

 

Robots.txt

Añadir el siguiente código a tu archivo robots.txt:

Disallow: *?replytocom

Esta opción solo debes usarla en alguno de los dos casos siguientes:

  1. Google no ha indexado tus páginas.
  2. Google ha terminado de des indexar tus páginas.

Básicamente le estamos diciendo a Google que al revisar nuestro sitio no tome en cuenta las páginas que contengan ?replytocom.

Si colocas esta línea de código en tu archivo robots.txt habiendo Google indexado tus páginas y sin haber solicitado su des indexación impedirás que Google pueda hacer su trabajo y las urls quedaran indexadas. No lo uses hasta que concluya la des indexación.

Mucho me temo que Franck Scipion ha cometido este error en su blog no habiendo des indexado antes las urls que contienen ?replytocom. Lo más probable es que no haya notado este problema.

robots.txt

Usar WordPress SEO by Yoast.

Este es un plugin para manejar el SEO de tu sitio web al estilo de otros como All in One SEO Pack pero permite eliminar la variable ?replytocom al final de la url. Si tienes http://tudominio.com/postX/?replitocom=123 este plugin hará que se quede en http://tudominio.com/postX/. Con lo cual al ser igual al post original estas páginas no serán creadas y se elimina la posible duplicación de contenidos antes de que ocurra.

Solo tienes que ir a la sección de permalinks en la configuración del plugin y marcar la casilla que permite eliminar los ¿replytocom. Puedes descargar el plugin aquí.

Si no deseas usar otro plugin más con las dos primeras opciones es más que suficiente.

Resumiendo

  1. Si tu sitio no ha sido indexado aun: Usa el robots.txt y eso es todo aunque no está demás  usar Google Webmaster Tools.
  2. Si ya fue indexado: Usa GWT para des indexarlo. Posteriormente usa robots.txt y mantén activo GWT.
  3. Adicionalmente puedes usar el plugin WordPress SEO by Yoast. Su uso es opcional y NO sustituye a los dos pasos anteriores si tus urls ya han sido indexadas. Aunque es un excelente plugin para SEO en ocasiones suele presentar problemas de compatibilidad con algunas plantillas y plugins. Úsalo a discreción.

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Categorías del Blog
Comprueba dominios libres