Python:
Verkkosivun lataaminen

How to: (Kuinka tehdä:)

import requests

# Web-sivun URL-osoite
url = 'http://www.example.com'

# Lähetetään GET-pyyntö ja tallennetaan vastaus muuttujaan
response = requests.get(url)

# Tarkistetaan onnistuiko pyyntö
if response.ok:
    # Tulostetaan sivun sisältö
    print(response.text)
else:
    print('Sivun lataaminen epäonnistui, virhekoodi:', response.status_code)

Esimerkkituloste:

<!doctype html>
<html>
<head>
    <title>Example Domain</title>
...
</head>
<body>
...
</body>
</html>

Deep Dive (Syväsukellus):

Historiallisessa kontekstissa web-sivujen lataaminen on ollut yleistä web-skrapingin alkuaikoina. Alkujaan tehtiin pelkkiä HTTP-pyyntöjä ilman kirjastoja. Nykyisin requests-kirjasto on Pythonin suosituin HTTP-client-kirjasto sen selkeän syntaksin ja toiminnallisuuden vuoksi.

Vaihtoehtoisia tapoja ladata sivuja Pythonissa ovat urllib-standardikirjaston moduulit tai kolmannen osapuolen kirjastot kuten httpx.

requests käyttää sisäisesti urllib3, ja sen peruskäyttö on helppoa: tee pyyntö, tarkista vastaus, ja käsittele data. Monimutkaisemmissa tapauksissa voi tarvita evästeiden käsittelyä, session ylläpitoa, tai erilaisia autentikaatio- ja yhteysasetuksia.

See Also (Katso Myös):