Python:
वेब पेज डाउनलोड करना
How to: (कैसे करें:)
import requests
# URL से डेटा प्राप्त करने का उदाहरण
url = 'http://example.com'
response = requests.get(url)
# स्टेटस कोड और प्राप्त हुआ कंटेंट
print(f"Status Code: {response.status_code}")
print(f"Page Content:\n{response.text}")
सैंपल आउटपुट:
Status Code: 200
Page Content:
<!doctype html>
<html>
<head>
<title>Example Domain</title>
...
<!-- और बहुत कुछ HTML कंटेंट यहाँ होगा -->
</head>
<body>
...
</body>
</html>
Deep Dive (विस्तृत विवरण)
जब इंटरनेट नया नया आया था, वेब पेज डाउनलोड करने के लिए FTP जैसे उपकरण प्रयोग में आते थे। पर, आज HTTP प्रोटोकॉल वेब पेज एक्सेस के लिए मानक बन चुका है। ‘requests’ मॉड्यूल Python में HTTP अनुरोधों को संभालने के लिए सबसे लोकप्रिय है क्योंकि यह सरल और शक्तिशाली है। इसके विकल्प में urllib है, लेकिन ‘requests’ बेहतर हैंडलिंग और सिंटैक्स प्रदान करता है। जब वेबपेज डाउनलोड किया जाता है, तो स्टेटस कोड, हेडर्स, और कंटेंट जैसे विस्तृत डाटा प्राप्त किया जा सकता है, जो कि डेवलपर्स के लिए कई सारे परीक्षण और विश्लेषण कार्यों में उपयोगी होता है।
See Also (और देखें)
- requests डॉक्यूमेंटेशन: Requests: HTTP for Humans
- Python urllib मॉड्यूल: urllib — URL handling modules
- वेब स्क्रेपिंग गाइड: Beautiful Soup Documentation
- HTTP स्टेटस कोड्स: HTTP Status Codes