Google, The Garbage Collector

4 nov

Há um mês iniciei uma “operação limpeza” para eliminar meus resultados do Google. O objetivo era verificar quanto tempo levaria para o indexador trazer resultados mais frescos e “me esquecer”. Minha primeira ação foi examinar todos os resultados que o buscador trazia para meu nome (com aspas). Percebi que a maioria se referia a serviços web que utilizo, assinaturas em sites de clientes e fóruns e notícias que comentei.

A limpeza começou por ofuscar os resultados, para isso troquei os nomes usados em redes sociais como Facebook, Twitter, LinkedIn e Google Plus. Como o pessoal do Google Plus gosta de fazer uma novelinha para trocar o nome (veja na imagem abaixo), excluí o perfil sem remorso algum. Para o caso das notícias e fóruns, mandei e-mails pedindo a alteração do conteúdo e, por fim, alterei lugares onde meu nome estava escrito em páginas que eu tinha acesso, sobrando apenas este blog, que usando as configurações do próprio WordPress escolhi que meu site deixasse de ser visível para buscadores.

Alguém pode explicar para o pessoal de Mountain View que, no mundo real, as pessoas raramente são perseguidas por publicadores megalomaníacos com o objetivo único de explicitar e manter histórico de tudo o que elas fazem nas ruas?

Minha teoria era que em duas semanas os resultados começassem a sumir, fiquei surpreso ao ver que 3 dias depois eles já diminuiram de 1370 para 1350, e mais surpreso ainda quando percebi que, em momentos de crise, nosso Garbage Collector entra em desespero e começa a apelar.

O primeiro fator estranho é que o resultado contendo meu perfil do Google Plus não desapareceu, mesmo tendo sido o primeiro registro a ser excluído e ser algo dentro do seu próprio domínio. Até aí tudo bem, eles só estão protegendo seu produto, mas tudo muda quando no primeiro resultado você lê a frase: Uma descrição para este resultado não está disponível devido ao arquivo robots.txt do site. Saiba mais. Isso mesmo, Google só respeita seu robots.txt quando é conveniente para ele.

Google desrespeitando regras de robots.txt

Robots.txt é um protocolo criado em 1994 que visa proteger o conteúdo de páginas na internet. Segundo o Google, ele respeita as regras do protocolo e na teoria não exibe resultados onde o Robots.txt está limitando seus robôs de vasculharem o site.

Outro fator extremamente estranho foi que depois das páginas internas do blog sumirem o número de resultados mais que dobrou, indo de 1350 em 7 de outubro para 3390 em 25 de outubro (screenshot acima). Acontece que, ao não ter conteúdo interessante suficiente para manter seus números altos, o buscador preferiu abriu seu leque para serviços secundários como Twitter, que seria colapsado em uma busca comum.

Hoje, exatamente um mês após o início da limpeza, tenho 2940 resultados e tive mais uma surpresa: Google Garbage Collector restaurou links inimagináveis como meu Badoo, excluído há mais de um ano, meu flavors.me que parecia nunca ter sido indexado, um perfil do Sonico que nem lembrava da existência e dezenas de sub-serviços sem relevância alguma.

Resumindo: Imagine o Google como um paparazzi atrás de você 24 horas por dia, batendo fotos da fachada da sua casa (Facebook), gravando o que você diz entre uma roda de conhecidos (Twitter) e stalkeando sua vida profissional (LinkedIn), mas quando você diz para ele que já chega, que você não está mais afim de ser perseguido, ele começa a revirar seu lixo para re-publicar coisas como sua ida à padaria ou a tropeçada que você deu na calçada quando um dálmata listrado cruzou seu caminho aos 7 anos de idade.

Post-Scriptum

Apesar do perfil do Google Plus ainda não ter desaparecido dos resultados até hoje, as referências ao Facebook foram retiradas menos de 2 semanas depois de eu trocar meu nome na rede social. Já o LinkedIn foi alterado há alguns dias, enquanto isso Twitter esta lá e parece que não pretende se mover.

2 Respostas to “Google, The Garbage Collector”

  1. rodrigobash novembro 5, 2012 (segunda-feira) às 1:13 #

    Fala Chris, mais um ótimo post. Essas informações são extremamente interessantes e também, perturbadoras. Começo a acreditar que mais para frente acabarei adquirindo uma espécie de síndrome de perseguição da Google. Fiquei mais neurótico do que era, depois deste post. De qualquer maneira, muito obrigado mais uma vez. Continue os posts e pesquisas, você ajuda muito.

    Abraços.

    Curtir

Trackbacks/Pingbacks

  1. Direito de ser esquecido | Christoffer Kraus - maio 14, 2014 (quarta-feira)

    […] corte da União Européia acha que o grande colecionador de lixo não está sendo criterioso suficiente em seus resultados e disse que as pessoas tem direito de […]

    Curtir

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: