
Gary Illyes ha publicado en Twitter sin que nadie le pregunte que las URLs HTTPS en un clúster duplicado tienen más posibilidades de convertirse en las URLs canonical.
Esto parece obvio, aunque está bien recordarlo, ya que desde hace un tiempo sabemos que Google intenta indexar por defecto las versiones https.
DYK that HTTPS URLs in a dup cluster have higher chance of becoming canonical? pic.twitter.com/1qIz6JAOUg
— Gary Illyes ᕕ( ᐛ )ᕗ (@methode) February 8, 2017
¿Pero a qué se refiere con clúster duplicado?
Se puede interpretar para varios casos. Por ejemplo, para varias URLs dentro del mismo dominio que apuntan al mismo contenido:
http://www.a.com/a
https://www.a.com/b
http://www.a.com/c
Otra versión es para URLs, dentro del mismo domino, con parámetros.
Y la versión a la que creo que hace referencia es a grupos de URLs de distintos dominios que tienen el mismo contenido. Por ejemplo agencias de noticias, notas de prensa, cambios de dominios, mirrors, scrapers o URLs con redirección que también pueden considerarse páginas duplicadas. Obviamente, existen muchas otras señales antes que bastan para desechar los scrapers de la competición.
Esto es así porque Google por defecto intenta indexar la versión HTTPS.