Java:
Pobieranie strony internetowej
How to:
W Java można to zrobić za pomocą java.net.HttpURLConnection
albo popularnych bibliotek takich jak Jsoup
. Oto prosty przykład użycia HttpURLConnection
:
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
public class WebPageDownloader {
public static void main(String[] args) throws IOException {
String urlString = "http://example.com";
URL url = new URL(urlString);
HttpURLConnection connection = (HttpURLConnection) url.openConnection();
try (BufferedReader reader = new BufferedReader(
new InputStreamReader(connection.getInputStream()))) {
String inputLine;
while ((inputLine = reader.readLine()) != null) {
System.out.println(inputLine);
}
} finally {
connection.disconnect();
}
}
}
Output będzie zawierał HTML pobranej strony.
Deep Dive:
Pobieranie stron internetowych w Javie ma długą historię. Wcześniejsze wersje Javy korzystały z URLConnection
, ale w praktyce częściej używa się HttpURLConnection
, która obsługuje specyfikę HTTP. Alternatywą jest biblioteka Apache HttpClient czy wspomniane Jsoup
, które oferują więcej funkcji i łatwość użycia. Apache HttpClient jest robustnym rozwianiem, odpowiednim do skomplikowanych zadań. Z kolei Jsoup
jest idealny do parsowania HTML, co sprawia, że jest wygodny w ekstrakcji konkretnych danych ze stron.