Bash:
Baixando uma página da web
How to:
Para baixar uma página da web com o Bash, podemos usar o curl
ou wget
. Aqui estão os exemplos:
# Usando curl
curl http://example.com -o example.html
# Saída esperada: Nenhuma, se tudo correr bem, o arquivo example.html será criado com o conteúdo da página.
# Usando wget
wget http://example.com
# Saída esperada: O wget irá mostrar o progresso do download e salvará a página como index.html por padrão.
Deep Dive
Historicamente, o wget
está por aí desde 1996, com a ideia de ser uma ferramenta para recuperar conteúdo da web via linha de comando. O curl
veio logo depois, em 1997, oferecendo mais protocolos e uma biblioteca (libcurl) para os desenvolvedores.
Existem alternativas. Por exemplo, você pode usar o lynx -dump -nolist http://example.com > example.html
para baixar o texto de uma página web com o navegador de texto Lynx.
Implementar o download de uma página web também pode envolver cuidados com a etiqueta da internet, como respeitar o arquivo robots.txt
de um site, e lidar com as questões de segurança, como a validação de certificado SSL.
See Also
man curl
man wget
- Project website for curl
- Project website for wget
- Lynx Browser