• Resolvido Pedro P

    (@pedro-p)


    Boas!

    Preciso criar um ficheiro Robots.txt para colocar no meu site, no entanto não quero “abrir portas”. Não muito entendido nesta parte…Alguém me pode ajudar?
    Quero permitir a indexação da pesquisa ao conteúdo do site a todos os web crawlers, mas restringir o acesso a pastas e á parte administrativa. Estou a pensar bem?

    Obrigado!

A visualizar 4 respostas - de 1 a 4 (de um total de 4)
  • Pedro, não precisa criar um ficheiro.

    Basta criar o arquivo robots.txt, esse arquivo é um arquivo simples de texto, ele precisa ter exatamente esse nome para facilitar a consulta dos “bots”, e dentro dele serão colocadas as diretrizes que os “robots” (robôs, bots, crawlers, spiders etc), softwares automatizados em geral; seguirão ao entrar em seu site.

    Como é um arquivo simples de texto, não há muito perigo, além disso a permissão padrão do seu site será suficiente para executa-lo.

    Quase todo site tem, e fica na pasta raiz do domínio, veja por exemplo o robots.txt do wordpress.org:

    https://wordpress.org/robots.txt

    As designações do seu robots.txt tem haver com o que você deseja bloquear ou não, então dê uma olhada nesse arquivo para que você possa criar o seu:

    https://support.google.com/webmasters/answer/6062596?hl=pt-BR

    e aqui uma ferramenta que facilitará a criação:

    http://www.marketingdebusca.com.br/robots-txt/

    Thread Starter Pedro P

    (@pedro-p)

    Olá Vini!

    Obrigado pela disponibilidade!

    Na verdade eu já corri bastantes sites de ajuda mas como não sou muito entendido neste assunto, fico sempre com algum receio de não fazer bem.

    Consegue me dizer se fazendo desta forma dou permissão (sem usar o comando “Allow”) a todos os webcrawlers a todo o conteúdo do meu site, excepto da zona de admnistração do mesmo:

    User-agent: *
    Disallow:
    Disallow: /wp-admin

    Ou tenho de especificar todos os webcrawlers?

    Obrigado mais uma vez!
    Pedro P

    Olá @pedro P ao utilizar o asterisco você se refere a todos os “webcrawlers”. Para seu robots.txt ficar perfeito você só precisa tirar esse Disallow que não faz referência a nada. Ficando seu robots.txt correto assim:

    User-agent: *
    Disallow: /wp-admin

    Se precisar bloquear alguma outra pasta além da wp-admin, é só adicionar na sequência, sempre o Disallow precisa fazer uma referência ao conteúdo que deseja bloquear para evitar bloquear o domínio por completo. Se além dessa quiser bloquear as páginas de arquivos por exemplo:

    User-agent: *
    Disallow: /wp-admin/
    Disallow: /archive/

    E por aí em diante, entendeu?

    Isso também serve para bloquear posts específicos, por exemplo:

    User-agent: *
    Disallow: /wp-admin/
    Disallow: /archive/
    Disallow: /nome-do-post.html
    Disallow: /?p=123

    É só fazer a referência ao que deseja bloquear, pode ser uma pasta, um post,arquivos web (.php, .html, .css, .js etc) até uma imagem ou vídeo.

    User-agent: *
    Disallow: /wp-admin/
    Disallow: /archive/
    Disallow: /nome-do-post.html
    Disallow: /?p=123
    Disallow: /imagem-exemplo.jpg
    Disallow: /video-exemplo.mp4

    é por aí…

    Abraço.

    Thread Starter Pedro P

    (@pedro-p)

    Olá Vini!
    Muito Obrigado!!

    Eu tinha colocado o seguinte:

    User-agent: *
    Allow: *

    Mas continua a aparecer isto:
    “A description for this result is not available because of this site’s robots.txt – learn more.”

    Penso que poderá ser um erro de script. Eu não tenho acesso á raíz do site mas vou alterar e consultar quem tem acesso.

    Muito obrigado mais uma vez!
    Abrc!

    Pedro P

A visualizar 4 respostas - de 1 a 4 (de um total de 4)
  • O tópico ‘Criar um ficheiro Robots.txt’ está fechado a novas respostas.