Como usar o robots.txt: guia completo para iniciantes!
Um arquivo robots.txt informa aos robôs de rastreamento (ex: Google Bot) quais pastas, arquivos e páginas do seu site não podem ser acessados e analisados.
Por padrão, um robô pode acessar e analisar todo o conteúdo do site para entender o que deve ser indexado e exibido nos resultados de pesquisa, mas será que isso é bom?
Se preferir, acesse “Como usar o robots.txt: guia completo para iniciantes!” no YouTube.
Imagine que seu site tenha páginas de autenticação, arquivos .pdf temporários, pasta para download de arquivos, conteúdo em desenvolvimento e teste, ou páginas que devem ser acessadas apenas através de links diretos, nesse caso você pode considerar em dizer para o Google não rastrear esses materiais usando o robots.txt, poupando assim recursos do seu servidor e limitando o que é importante.
É importante lembrar que uma página do seu site protegida por robots.txt ainda poderá ser indexada se estiver vinculada a outros sites e com isso aparecer nos resultados de pesquisa. Se você quiser bloquear a indexação e exibição de uma página no Google, deverá usar a metatag noindex ou cabeçalho HTTP, como ensino aqui mesmo no meu site.
Outro ponto importante é saber que o robots.txt bloqueia apenas o rastreamento de robôs e tem foco em resultado de pesquisa. Se você…
Acesse o conteúdo completo sobre Como usar o robots.txt: guia completo para iniciantes! no site oficial do Aylton Inacio, que tem muito conteúdo sobre desenvolvimento web, analytics, bi, armazenamento e análise de dados, através de artigos, tutoriais e cursos online.
Comentários
Postar um comentário