Descargando una página web

Python:
Descargando una página web

How To:

Usaremos requests, una biblioteca de Python fácil de usar para solicitudes HTTP:

import requests

# Enviar solicitud GET a una página web
respuesta = requests.get('https://example.com')

# Verificar que la solicitud fue exitosa
if respuesta.status_code == 200:
    # Escribir contenido a un archivo local
    with open('pagina_descargada.html', 'w', encoding='utf-8') as archivo:
        archivo.write(respuesta.text)

    print("Descarga completa!")
else:
    print("Error en la descarga:", respuesta.status_code)

Cuando ejecutes el código, verás “Descarga completa!” si todo va bien, o un mensaje de error con el código del estado HTTP si no.

Deep Dive

En la historia, se usaba urllib para descargar páginas web, pero requests simplificó mucho las cosas. Si bien requests es perfecto para tareas simples, hay otras librerías como Scrapy para scraping avanzado o Selenium cuando necesitas imitar un navegador real interactuando con JavaScript. Internamente, requests maneja cosas como mantener la sesión o gestionar cookies, lo que nos libera de ese peso.

See Also