Python:
Завантаження веб-сторінки
Як це зробити:
Ось як можна завантажити вміст веб-сторінки у Python за допомогою модуля requests
.
import requests
# Надсилаємо GET-запит до веб-сторінки
response = requests.get('https://example.com')
# Переконуємося, що запит був успішним
if response.ok:
# Виводимо вміст сторінки
print(response.text)
Якщо запустити код, ви побачите HTML веб-сторінки example.com в консолі.
Поглиблений Розгляд:
У минулому для завантаження вмісту веб-сторінки використовувалися такі інструменти, як urllib
. Проте модуль requests
став золотим стандартом через свою простоту та зручність.
Альтернативою requests
може бути використання http.client
або зовнішніх інструментів, таких як Curl в командному рядку. Для парсингу HTML часто використовується BeautifulSoup
, а для JavaScript-важких сторінок - Selenium
.
Внутрішньо, завантаження сторінки робить HTTP або HTTPS запит. GET
запити використовуються для отримання вмісту, тоді як POST
і інші типи запитів для відправлення даних.
Дивіться також:
- Документація модулю requests: https://requests.kennethreitz.org/en/master/
- BeautifulSoup документація: https://www.crummy.com/software/BeautifulSoup/bs4/doc/
- Selenium документація: https://selenium-python.readthedocs.io/
- Руководство по Curl: https://curl.se/docs/manual.html