Como funciona arquivos robots


Como o próprio nome já diz, robots.txt é um arquivo no formato .txt (bloco de notas), onde pode ser editado em qualquer aplicativo como bloco de notas e notepad do Windows.

Funciona como um filtro para os robôs de mecanismos de pesquisa controlar permissões de acesso em determinada página ou pastas dos sites, se deve ou não serem indexadas.

Como devo configurar?

A sintaxe do Robots.txt é uma estrutura muito simples, configuradas com comandos específicos para que os buscadores entendam a mensagem que deseja passar.

Comandos Robots.txt

Utilize o comando abaixo para indexar em todos os mecanismos de buscas

User-agent: *

(ou simplesmente não incluir o comando user-agent)

Caso queira definir para mecanismo de busca específicos, utilize o comando abaixo:

Google: User-agent: Googlebot
Google Imagens: User-agent: Googlebot-images
Google Adwords: User-agent: Adsbot-Google
Google Adsense: User-agent: Mediapartners-Google
Yahoo: User-agent: Slurp
Bing: User-agent: Bingbot

Disallow

O comando guia os buscadores sobre quais diretórios ou páginas não devem ser indexadas nos buscadores.

Disallow: /segredo - orienta aos robots a não indexarem pastas ou arquivos que comecem com "segredo";
Disallow: /segredo/ - orienta aos robots a não indexarem conteúdo dentro da pasta "segredo"
Disallow: pagina-teste.html - orienta aos robots a não indexarem conteúdo da página pagina-teste.html.

Allow

Ao contrário do procedimento anterior, esse o comando Allow permite que os buscadores indexem determinas páginas e pastas. Diretórios e páginas são por definição sempre permitidos. Assim, este comando deve ser utilizado apenas em situações em que o webmaster bloqueou o acesso a um diretório por meio do comando Disallow, mas gostaria de ter indexado um arquivo ou sub-diretório dentro do diretório bloqueado. Note por exemplo no robots.txt do Google, logo no início, as duas linhas abaixo. O Allow permite que seja indexado o diretório /sobre abaixo do diretório /catalogos.

Disallow: /catalogos

Allow: /catalogos/sobre

Exemplos de arquivo robots.txt

Apesar de ser simples a configuração, não dispensa cuidados nas configurações. Você também pode olhar exemplo de configurações em site grande como Google ou Facebook.

¿Fue útil la respuesta?

Imprimir éste Artículo

Artículos Relacionados

Como alterar senha hospedagem cPanel

A senha pode ser alterada através do painel do cliente de uma forma bem simples e fácil. Para...

Como efetuar backup completo de uma conta do cPanel?

Como efetuar backup completo da conta do cPanel Acesse o cPanel de seu site. Desça até Arquivos...

Como faço para colocar o meu site no ar?

Para colocar o seu site no ar acesse a opção gerenciador de arquivos do painel de controle cpanel...

Como um Painel de Controle pode ajudar o meu site?

O painel de controle é uma interface gráfica com ícones que apontam para as ferramentas...

O que é CDN, Content Delivery Network ou Rede de distribuição de conteúdo?

CDN, Content Delivery Network ou Rede de distribuição de conteúdo é um sistema que pode ser...