Ruby:
Pobieranie strony internetowej
Co i dlaczego?
Pobieranie strony internetowej to proces ściągania jej zawartości do analizy lub przetwarzania. Programiści robią to, by np. zbierać dane (web scraping), monitorować zmiany czy testować aplikacje.
How to:
Jak to zrobić:
Przykład w Ruby wykorzystuje gem net/http
do pobrania strony:
require 'net/http'
require 'uri'
def download_webpage(url)
uri = URI(url)
response = Net::HTTP.get(uri)
puts response
end
download_webpage('http://example.com')
Sample output (wyjście próbkowe):
<!doctype html>
<html>
<head>
<title>Example Domain</title>
...
</head>
<body>
...
</body>
</html>
Deep Dive
W głąb tematu
W Ruby, klasy z modułu net/http
są używane od lat do interakcji z HTTP. Alternatywą jest open-uri
dla prostych zastosowań lub gem httparty
dla większej kontroli nad żądaniami. Głębsze szczegóły implementacji net/http
obejmują obsługę różnych metod HTTP, szyfrowanie SSL/TLS i możliwość pracy z proxy.
See Also
Zobacz również
- Ruby
Net::HTTP
dokumentacja: https://ruby-doc.org/stdlib/libdoc/net/http/rdoc/Net/HTTP.html httparty
gem: https://github.com/jnunemaker/httparty- Przewodnik po web scraping w Ruby: https://www.rubyguides.com/2012/01/web-scraping-tutorial-ruby/