Aproveitando a mina de dados do Google

Anonim

Você já pesquisou no Google hoje? Você alcançou esta página por "googling"?

Nesse caso, você viu o futuro e faz parte dele, mesmo que ainda não tenha percebido. Na verdade, há muito mais acontecendo no Google do que apenas pesquisar. Eu vou falar sobre o que o Google faz, sabe - como também o que você deve fazer e saber para tirar o máximo proveito disso.

$config[code] not found

É verdade que o Google é mais conhecido por seu poderoso mecanismo de busca, que utiliza uma enorme base de dados de páginas da Web, vídeos, imagens, cotações de ações, números de telefone, endereços e outros pedaços de mídia e dados para fornecer informações relevantes. tempo que leva para atacar uma chave.

O nome do maior mecanismo de pesquisa do mundo tornou-se sinônimo de pesquisa na Internet. É até se tornar um verbo em nossa linguagem cotidiana (mesmo que o Google não goste de usar isso dessa maneira): as resenhas de carros do Google, o endereço atual de nosso amigo de infância e, em vôos de fantasia e grandeza, a nós mesmos.

É fácil esquecer que não estamos sozinhos quando pesquisamos. Tudo o que fazemos dentro do ambiente do Google (e algumas coisas que fazemos fora dele) são gravados, armazenados e analisados. Quando você souber que uma empresa tem tantos dados disponíveis, não demorará muito para perceber que todas essas informações podem ser usadas para muito mais do que apenas uma experiência de pesquisa agradável.

Para entender completamente o potencial do Google, relaxe por alguns instantes e pense em como o Google funciona com mais detalhes. Como o Google funciona

Para o pesquisador casual, não é imediatamente aparente como o Google pesquisa a Internet tão rapidamente e com resultados tão bons. O segredo é que quando você digita uma consulta, eles não estão pesquisando na Internet; Em vez disso, o Google está pesquisando um banco de dados em constante crescimento e atualização, 24 horas por dia, 7 dias por semana.

Tudo isso acontece sem qualquer intervenção humana. Pequenos programas chamados "spiders" ou "crawlers" seguem independentemente os links de uma página para outra, da mesma forma que uma aranha segue os fios de sua teia. À medida que as aranhas percorrem as páginas da Web, elas coletam informações sobre cada frase, imagem, número de telefone e qualquer outra coisa que possam encontrar. Eles verificam cada página que visitam, indexam palavras-chave e anotam links para e da página. Então esta informação é armazenada em um banco de dados massivo. Os mesmos links e páginas são rastreados várias vezes, garantindo que as informações do Google permaneçam atualizadas.

O Google classifica as páginas usando as informações coletadas por suas aranhas. Incluídos neste processo de classificação estão os seguintes:

  • frequência e localização de palavras-chave (mais palavras-chave em locais mais proeminentes são melhores);
  • a idade da página (quanto mais bem estabelecida a página, melhor);
  • o número de páginas que ligam a uma página (quanto mais links, melhor).

Há outros fatores que o Google considera também, mas estes são mantidos em segredo para impedir aqueles que tentam jogar o sistema e obter altos níveis sem realmente fornecer informações úteis. Além disso, se você exagerar e simplesmente preencher sua página com informações redundantes, listas de palavras-chave e links indesejados, o Google penalizará você ou poderá até mesmo excluir seu site do banco de dados. Claramente, um bom equilíbrio deve ser atingido. Esse equilíbrio de fatores na página é tanto arte quanto ciência.

Quanto melhor as pontuações de página de acordo com esses critérios, maior será a classificação nos resultados da pesquisa. As páginas com o melhor ranking aparecem na primeira página de uma pesquisa no Google. uma vez que a maioria dos usuários do Google nunca se aventura além dessa primeira página, essas páginas de alto nível obtêm uma quantidade desproporcional de tráfego na Internet.

Tudo isso para dizer que, quando você faz uma pesquisa no Google, ele pode responder rapidamente porque não está tentando pesquisar toda a Internet naquele momento; está consultando seu banco de dados altamente organizado e priorizado. Mas, ainda mais importante do que criar pesquisas rápidas, significa que o Google tem um vasto repositório de dados sobre o que está na Internet e, mais importante, quem está usando o quê, quando e com que finalidade.

O que o Google sabe?

O Google "sabe" muito, na verdade. O Google acompanha as pesquisas e até mantém um arquivo em suas pesquisas específicas com base no seu endereço IP ou no login do Google. Isso lhes dá uma pequena janela em sua mente, revelando o que te interessa, te preocupa, te excita e te assusta. Isso por si só é uma poderosa informação de marketing.

Se você pudesse acessar esse banco de dados, seria capaz de construir perfis detalhados sobre os indivíduos - seus interesses, hábitos de compra, preocupações com a saúde, problemas familiares e muito mais. Você pode descobrir sinais sugerindo se uma empresa está tendo sucesso ou falhando, se está considerando uma fusão ou aquisição e em quais linhas de produto ela pode estar se expandindo. Você pode acompanhar as tendências históricas nas eleições, na economia, nos serviços de saúde e em qualquer outra área que tenha um valor social, financeiro e político significativo.

Além disso, se você, consciente ou inconscientemente, fizer uso de outros serviços do Google, estará fornecendo ainda mais informações. Eles verificam o Gmail, obtendo as mesmas informações de sua correspondência que suas pesquisas, bem como quem são seus amigos e colaboradores. Se você compartilha documentos por meio do Google Docs, eles sabem com quem você trabalha e em quais projetos. O Google Checkout adiciona dados sobre seus padrões de compra, seus hábitos de gastos e seu orçamento.

Há também informações que você transmite ao Google sem saber que você está fazendo isso. O Google coleta, assim como outros serviços da Internet, seu endereço IP e, possivelmente, seu endereço MAC. Seu endereço IP informa a eles aproximadamente onde você está no mundo geograficamente, e seu endereço MAC é uma assinatura exclusiva da sua máquina; Isso permite que eles rastreiem se você sempre usa a mesma máquina, quantas máquinas usa e assim por diante. Assim, o Google não apenas sabe o que você está procurando e com quem está se comunicando, mas também sabe onde você está e quais máquinas ou máquinas estão usando.

Claro, vamos dar um passo atrás e admitir que quase qualquer site da Internet tem acesso a algumas ou todas essas informações. Por exemplo, endereços IP são coletados regularmente para se defender contra ataques de hackers e negação de serviço. As informações sobre onde você acessa o site de alguém, quando você chega e sai, e de onde você vem e para onde está, são todas as estatísticas padrão da Web disponíveis até mesmo para o menor site pessoal.

O que torna o Google diferente é seu tamanho e diversidade de serviços, permitindo que ele colete uma variedade maior de informações de muito mais pessoas.

Quando seu estoque de informações vai de centenas de dados a bilhões, você tem uma visão que ninguém mais faz. O que torna o Google realmente poderoso é que ele pode observar pessoas em mais contextos do que qualquer outra pessoa. O Google está assistindo você mesmo quando você não está no seu computador. O Google Maps fornece fotos de alta resolução da maioria dos Estados Unidos, bem como de algumas outras áreas do mundo. É provável que sua casa possa ser vista no Google Maps e, se você estiver regando o jardim quando o satélite passar, você também poderá se ver com seu par de shorts mais velozes!

O que o Google pode fazer

Há alguns usos bastante óbvios para o banco de dados do Google, e talvez o Google AdWords seja o mais popular e visível no momento.

Cada vez que você faz uma pesquisa no Google, as primeiras listagens no topo da página e as listagens no lado direito são "links patrocinados", anúncios pagos comprados por pessoas que acreditam que os pesquisadores que executam uma pesquisa como a sua estaria interessado em seus bens e serviços. Essa técnica se espalhou para outras páginas da Web, o que explica o apelido de "Anúncios do Google" que você vê exibindo anúncios relevantes para as páginas de outros websites.

Claramente, a venda deste espaço publicitário é uma excelente fonte de receita para o Google. Em 2007, o Google AdWords trouxe ao Google mais de US $ 16 bilhões em receita, tornando-se a maior fonte de renda do Google até o momento. Em comparação, a loja de dados do Google é uma mina de ouro que mal foi aproveitada.

Até agora, os recursos do Google que temos visto se concentraram principalmente em reagir às tendências atuais do mercado. As pessoas se interessam por algo - a nova versão do X-Box, encontrar um eletricista on-line, memorabilia do Super Bowl etc. - e o Google está posicionado para ajudar as pessoas a se conectarem com seus clientes em potencial.

No entanto, com informações suficientes, uma empresa como a Google pode fazer mais do que simplesmente reagir ao presente com a velocidade da luz. Também pode ver o futuro ou até mesmo criar o futuro. Antes que você pense que isso é apenas um devaneio de ficção científica paranóico, leve em consideração o assunto.

Vamos pegar um caso simples. Suponha que você configure um programa para observar pesquisas que não conseguem encontrar nenhuma pesquisa fracassada de páginas altamente ordenadas que não forneça nenhuma informação realmente útil ao pesquisador. O programa que rastreia essas falhas observa o que o pesquisador queria e coloca essas pesquisas com falha nas categorias.

Analisando essas estatísticas, o que acontece se o Google perceber que há um grande número de buscas fracassadas relacionadas a encontrar uma superloja do tipo "faça você mesmo" em Thermopolis, WY. Um pouco mais olhando, e eu tenho uma lista de lugares onde há muitas buscas de localizador de superstore de DIY falhadas. Essa lista seria incrivelmente valiosa para uma empresa que franquiasse as lojas de bricolagem (sem nomear nenhum nome, mas pense naqueles grandes armazéns laranja em todos os subúrbios: eles não gostariam de saber?).

Eles não apenas saberiam que não havia nenhuma loja de bricolagem lá, mas que um número específico de pessoas estava procurando por uma loja desse tipo. E eles provavelmente teriam alguma idéia do que esperavam comprar lá: eletrodomésticos, materiais de construção, grelhadores a gás, etc. Essa é uma pesquisa de mercado indolor, cuidadosamente classificada e analisada pelo Google automaticamente.

Da mesma forma, essas informações poderiam ser usadas para identificar potenciais compradores de um determinado produto, rastrear criminosos envolvidos em pornografia infantil e capturar ladrões em potencial que abrigam uma casa ou loja. Ele pode ajudar os desenvolvedores a escolher sites para novas residências e lojas, avisá-lo sobre condições climáticas severas em sua região, localizar eleitores registrados e aprender sobre seus hábitos e interesses e ajudar a Receita Federal a encontrar pessoas que traem seus impostos. Também pode haver erros de interpretação: um monte de buscas sobre o câncer de uma pequena cidade pode significar muitos pacientes com câncer, mas também pode significar que há uma faculdade de medicina lá.

Como você pode ver, podemos aplaudir alguns dos usos dessa informação e condenar os outros. Mas todos são possíveis e todos usam as mesmas técnicas básicas. Você pode encontrar quase tudo o que quiser, você só precisa saber como procurá-lo.

No meu próximo artigo, vamos dar uma olhada no que tudo isso significa para você como um indivíduo … e como um empreendedor. Salte para: A mina de dados do Google e seu negócio.

* * * * *

Sobre o autor: Hamlet Batista é presidente da NEMedia S.A, uma fornecedora de software de automação de SEO que ajuda empreendedores e pequenas empresas a aumentar a qualidade de seu tráfego de busca natural enquanto se concentra no que faz melhor. O blog de Hamlet, Hamlet Batista dot Com, explora a pesquisa de SEO mais avançada, bem como estratégias e táticas que podem lhe dar uma vantagem importante sobre seus concorrentes.

17 Comentários ▼