O Google (NASDAQ: GOOGL) sugeriu recentemente mais medidas para eliminar conteúdo duplicado na web. E proprietários de sites, incluindo proprietários de pequenas empresas, podem querer prestar atenção, considerando que o mecanismo de busca tem um histórico de, eventualmente, penalizar sites por não tomarem cuidado.
Google Noindex Advice
Especificamente, sites atualmente republicando conteúdo originado de autores originais agora são encorajados a “noindex” esse conteúdo. Esse conselho do Google noindex é algo que a maioria dos criadores de conteúdo provavelmente não seguirá.
$config[code] not foundEm uma luta para classificar na primeira página do Google, especificamente os cinco principais resultados de pesquisa, os sites - incluindo os principais meios de comunicação - frequentemente republicam artigos populares. A aplicação de noindex a todos esses artigos distribuídos solucionaria uma das maiores dores de cabeça do Google: conteúdo duplicado. Mas até agora, a recompensa por isso parece muito alta.
Sobrecarga de conteúdo duplicado
Atualmente, praticamente todas as principais fontes de notícias, incluindo: NY Times, Wall Street Journal, Washington Post, MSNBC, Fox News e outras, simplesmente re-postam conteúdo sem aplicar noindex. O conteúdo geralmente vem de fontes de notícias sindicalizadas como a Associated Press ou a Reuters.
Procure qualquer título no Google e, sem dúvida, você terá milhares de fontes com conteúdo idêntico, escreve o especialista em SEO Barry Schwartz, da Search Engine Roundtable. Ironicamente, os principais resultados da pesquisa geralmente não são a fonte original. No entanto, a maioria dos sites continuará esta prática em busca da recompensa de alto tráfego para seu endereço na web.
Em uma recente troca de Twitter sobre um tópico relacionado, o analista de tendências do webmaster do Google, John Mueller, sugeriu que os sites não deveriam estar marcando esse contexto para indexação pelo mecanismo de pesquisa:
Conteúdo de marcação Noindex significa sem tráfego do Google
Noindexing é praticamente o oposto do que a maioria dos sites quer fazer.
A tag noindexing é um valor HTML aplicado ao conteúdo com o objetivo de impedir que os mecanismos de pesquisa o classifiquem. Ele é aplicado no back-end da administração da web e é normalmente usado para dados privados ou arquivos vinculados a grandes bancos de dados.
Isso, obviamente, é uma má notícia para sites que ganham a vida - pelo menos em parte - de republicar conteúdo. E proprietários de sites de pequenas empresas que tentam compensar a falta de conteúdo original em seus sites com artigos republicados de outras fontes também devem se preocupar.
Esta não é a primeira vez que o Google pressiona para remover conteúdo duplicado excessivo da web. Também parece provável que o mecanismo de busca acabe respondendo com uma mudança de algoritmo que reduz os sites com muito desse conteúdo. Enquanto isso, no entanto, o passo noindex parece algo que o Google está simplesmente solicitando aos webmasters.
Google quer um mundo sem conteúdo duplicado
Se é prático no momento ou não, fica claro que o ideal do Google é a Web, onde apenas uma cópia de cada conteúdo é indexada para classificação no mecanismo de pesquisa.
Embora possa levar algum tempo para que isso aconteça, sites e criadores de conteúdo seriam sábios para desenvolver seus modelos de negócios.
No futuro da Web, aqueles com conteúdo original não só governarão, como provavelmente serão os únicos que restarão.
Copie a foto da máquina via Shutterstock
Mais em: Google