Muitos usuários do Windows estão tão acostumados à interface gráfica e ao navegador da Web como a ferramenta universal de escolha que esquecem que existem várias outras ferramentas por aí. O Wget é um utilitário de linha de comando GNU, popular principalmente nas comunidades Linux e Unix, usado principalmente para baixar arquivos da Internet. No entanto, existe uma versão do wget para Windows e, usando-o, você pode baixar o que quiser, de sites inteiros a filmes, músicas, podcasts e arquivos grandes de qualquer lugar online.
Poucos usuários da Microsoft conhecem essa ferramenta interessante, e foi por isso que escrevi este guia para iniciantes sobre o uso do wget no Windows. Tendemos a usar nosso navegador para tudo, o que é bom, mas nem sempre é a maneira mais eficiente de conseguir algo. O Wget é apenas uma das muitas ferramentas que existem há eras, mas muito poucas pessoas conhecem.
Obtendo o wget para Windows
Links Rápidos
- Obtendo o wget para Windows
- Baixe um único arquivo
- Baixe um único arquivo, mas salve-o como outra coisa
- Baixar para uma pasta específica
- Retomar um download interrompido
- Baixe uma versão mais recente de um arquivo
- Baixe várias páginas da web
- Baixe um site inteiro
- Baixe um tipo de arquivo específico de um site
- Baixe todas as imagens do site
- Verifique um site para links quebrados
- Baixe arquivos sem sobrecarregar o servidor web
Conseguir o wget é muito fácil. Siga este guia para instalar e configurar o wget.
- Baixe o wget a partir daqui e instale-o. Verifique se é o programa de instalação e não apenas a fonte, caso contrário não funcionará.
- Depois de instalado, agora você poderá acessar o comando wget a partir de uma janela da linha de comandos. Abra uma janela do CMD como administrador e digite 'wget -h' para testar. Se funcionar, você é de ouro; se você receber um 'comando não reconhecido', baixou o pacote errado. Tente novamente.
- Defina um diretório de download para salvar todos os seus arquivos. Digite 'md \ directory name' para criar um diretório de download. Chamei o meu 'downloadz' para ser reconhecível.
Depois de instalado, você está pronto para trabalhar. Abaixo, listei uma seleção de comandos populares do wget que podem alcançar uma grande variedade de coisas.
Baixe um único arquivo
wget http://website.com/file.zip
Baixe um único arquivo, mas salve-o como outra coisa
wget ‐‐putput document = newname.html website.com
Baixar para uma pasta específica
wget ‐‐directory-prefix = pasta / subpasta website.com/file.zip
Retomar um download interrompido
wget ‐‐ontinuar website.com /file.zip
Baixe uma versão mais recente de um arquivo
wget ‐continue ‐‐timestamping website.com/file.zip
Baixe várias páginas da web
Para isso, você precisa criar uma lista no bloco de notas ou em outro editor de texto. Adicione um novo URL completo (com http: //) em uma linha separada. Em seguida, aponte o wget para o arquivo. Neste exemplo, chamei o arquivo Filelist.txt e o salvei na pasta wget.
wget ‐‐put Filelist.txt
Baixe um site inteiro
wget ‐execute robots = off ‐ ‐recursive ‐‐no-parent ‐‐continue ‐‐no-clobber http://website.com
Você pode achar que, como costumo fazer, os hosts da web bloqueiam os comandos wget. Você pode tentar falsificar esses blocos personificando o Googlebot. Tente digitar o seguinte:
wget –user-agent = ”Googlebot / 2.1 (+ http: //www.googlebot.com/bot.html)” -r http://website.com
Baixe um tipo de arquivo específico de um site
wget ‐‐level = 1 ‐‐recursivo --‐ sem pais --‐ aceitar FILETYPE http://website.com / FILETYPE /
Por exemplo, altere FILETYPE para MP3, MP4, .zip ou o que quiser.
Baixe todas as imagens do site
wget -‐directory-prefix = arquivos / imagens - sem diretórios - recursivo - sem clobber - aceita jpg, gif, png, jpeg http://website.com/images/
Verifique um site para links quebrados
wget ‐‐putput-file = logfile.txt ‐‐recursive ‐‐ spider http://website.com
Baixe arquivos sem sobrecarregar o servidor web
wget ‐limit-rate = 20k ‐‐wait = 60 ‐‐ random-wait ‐‐mirror http://website.com
Existem centenas, senão milhares de comandos do wget e eu mostrei apenas alguns deles aqui. Agora que você está familiarizado com a ferramenta e como ela funciona, é com você que você a usa!
Você tem algum comando interessante que pode realizar maravilhas? Compartilhe-os abaixo!