Загрузка веб-страницы

C++:
Загрузка веб-страницы

Как это сделать:

В текущей версии C++, вы можете использовать библиотеку CURL для скачивания веб-контента. Вот простой пример:

#include <curl/curl.h>
#include <iostream>
#include <string>

static size_t writeCallback(void* contents, size_t size, size_t nmemb, void* userp){
    ((std::string*)userp)->append((char*)contents, size * nmemb);
    return size * nmemb;
}

int main() {
    CURL* curl;
    CURLcode res;
    std::string readBuffer;

    curl = curl_easy_init();
    if(curl) {
        curl_easy_setopt(curl, CURLOPT_URL, "http://example.com");
        curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, writeCallback);
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, &readBuffer);
        res = curl_easy_perform(curl);
        curl_easy_cleanup(curl);

        if(res == CURLE_OK) {
            std::cout << readBuffer << std::endl;
        }
        else {
            std::cerr << "Ошибка CURL: " << curl_easy_strerror(res) << std::endl;
        }
    }

    return 0;
}

Пример вывода:

<!doctype html>
<html>
<head>
    <title>Пример домена</title>
    ...
</head>
<body>
    <div>
        <h1>Пример домена</h1>
        <p>Этот домен используется для иллюстративных примеров в документах. Вы можете использовать этот домен ...</p>
    </div>
</body>
</html>

Углубляемся

Изначально не существовало стандартного способа скачивания веб-страниц с помощью C++. Программисты использовали платформо-зависимые решения или различные сторонние библиотеки. Теперь libcurl - это широко поддерживаемая и универсальная библиотека для передачи данных с URL. Компилируемая и связываемая с вашим кодом на C++, curl является предпочтительным инструментом.

Альтернативы libcurl включают HTTPClientSession от Poco и C++ Rest SDK (известный как Casablanca). В то время как libcurl основан на C и является примерно настолько низкоуровневым, насколько это возможно комфортно для HTTP-запросов, Poco и Casablanca предлагают более идиоматичные интерфейсы C++, которые могут нравиться некоторым пользователям.

Под капотом, когда вы скачиваете веб-страницу, в действие вступает протокол HTTP. На сервер отправляется GET-запрос, и, предполагая, что все проходит хорошо, сервер отвечает содержимым в HTTP-ответе.

См. также