Se filtra documento que Google brinda a su equipo de revisión de webs para definir la calidad de las mismas

Para que una web salga en primera página de resultados de Google para una búsqueda determinada debe ser evaluada no sólo por el algoritmo del buscador, sino en muchos casos también por un equipo de revisión manual que se encarga de analizar las páginas webs que el algoritmo selecciona para salir en buenas posiciones, especialmente para las búsquedas más populares. De esta manera Google se asegura que cualquier falla en el algoritmo sea cubierta muchas veces por las evaluaciones que realiza su equipo de revisión.

La novedad de esta semana ha sido la filtración de un documento oficial de Google (General Guidelines Version 3.18), en una versión actualizada al 30 de Marzo del 2011, en el cual la empresa brinda los lineamientos generales a sus revisores para definir la calidad de las páginas que el buscador ofrece como resultado a algunas búsquedas. Es decir, a cada revisor Google le asigna un grupo de resultados de consultas (queries) y estos deben evaluar la calidad de las web que salen en la página de resultados de Google de acuerdo a los lineamientos de este documento.

He leído ya las 123 páginas del documento (de imperdible lectura para todos aquellos que trabajamos en SEO) y hay varias curiosidades y datos interesantes por compartir.

  • El navegador “oficial” de los revisores de Google es Firefox, no Chrome como uno pensaría. El documento indica claramente a los revisores que deben utilizar Firefox para sus búsquedas, además de implementar la extensión Web Developer Toolbar
  • Existen hasta 6 escalas o ratings aplicables a una página web:
    • Vital, para websites “oficiales” de personas, lugares, negocios u organizaciones; así como para páginas que brindan el resultado exacto para búsquedas que solicitan información específica (por ejemplo, si busco “yahoo” la página web www.yahoo.com es el resultado calificado como “vital”)
    • Useful (Util), para páginas muy útiles para la mayoría de usuarios
    • Relevant (Relevante), para páginas útiles para muchos o algunos usuarios
    • Slightly Relevant (Ligeramente relevante), para páginas que no son muy útiles para la mayoría de usuarios, pero están de alguna forma relacionadas con la búsqueda.
    • Off-Topic or Useless (Fuera de tema o Inútiles), páginas útiles para muy pocos usuarios, o que no tienen utilidad ni relación alguna con el término buscado.
    • Unratable, para páginas que no pueden ser evaluadas (páginas que no cargan, páginas con mensajes de error, páginas en blanco, etc).
  • Google clasifica a los tipos de búsquedas de 3 formas (además de la posibilidad de que ciertas búsquedas se consideren combinaciones de estas definiciones básicas):
    • Consultas de acción, cuando el usuario quiere lograr un objetivo o iniciar una actividad a través de la búsqueda. Ej: descargar software, enviar flores, reservar un hotel
    • Consultas de información, cuando el usuario quiere encontrar información sobre un tema determinado. Ej: cómo actualizar a iOS 5, biografía de Steve Jobs, como anudar una corbata
    • Consultas de navegación, cuando el usuario realiza la consulta para llegar a una página web en particular. Ej: ibm, youtube, ebay, sunat
  • Google considera los siguientes factores importantes para una buena calificación manual de una web:
    • Idioma
    • Ubicación geográfica
    • Relevancia con respecto al término originalmente buscado
    • Relevancia con respecto a la intención de búsqueda del usuario
    • “Frescura” del contenido (que tan reciente es el contenido de la página, sobre todo para búsquedas relacionadas a eventos recientes o pasados)
  • Los revisores de Google manejan marcadores (flags) para designar páginas de spam, pornográficas, maliciosas (de distribución de virus, por ejemplo).
  • Cualquier página existente con el único fin de hacer dinero y no el de brindar información útil a los usuarios, es marcada por los revisores como spam.
  • Técnicas que los revisores utilizan para identificar rápidamente si una página debe ser marcada como spam:
    • Presionar CTRL+A para ubicar texto escondido en la página
    • Bajar hasta el final de la página para ver si hay texto escondido fuera del campo visual normal de la web
    • Desactivar Javascript y CSS de la web para encontrar texto escondido
    • Revisar el código fuente de la web para encontrar texto y enlaces escondidos
    • Páginas con sobre optimización de keywords (keyword stuffing)
    • Keyword stuffing en la URL (http://adriana-lima.modelos-brasileras.com/adriana-lima-hermosa-modelo/)
    • Cloaking (mostrar una cosa al buscador y otra a los usuarios) a través del uso de Javascript o iframes
  • Las páginas con letras de canciones o poemas son consideradas útiles para los usuarios, y no son marcadas como spam.
  • Los evaluadores realizan sus revisiones online, a través de un sistema denominad Rater Hub

Estos son sólo algunos de los muchos detalles interesantes de un documento, repito, de imperdible lectura.


Descargar documento filtrado de Google – general Guidelines 2011 (PDF 2.3MB)

Henry Silva
About Author

Henry Silva

Hola! Soy Henry Silva, webmaster de ilmaistro.com, emprendedor y empresario. Me gusta escribir sobre tecnología, me encantan las redes sociales y tengo mi propia empresa de servicios de posicionamiento web: Capybara SEO. Si deseas, puedes contactarme o saber más de mi.