Rust:
HTML विश्लेषण
कैसे करें:
रस्ट में HTML पार्स करने के लिए, आप अक्सर scraper
क्रेट का उपयोग करेंगे, जो HTML दस्तावेज़ों को ट्रैवर्स और मैनिपुलेट करने के लिए एक उच्च-स्तरीय इंटरफेस प्रदान करता है।
सबसे पहले, अपनी Cargo.toml
में scraper
जोड़ें:
[dependencies]
scraper = "0.12.0"
अगला, ये एक साधारण उदाहरण है जो एक दिए गए HTML स्ट्रिंग से सभी लिंक URL निकालता है:
extern crate scraper;
use scraper::{Html, Selector};
fn main() {
let html = r#"
<html>
<body>
<a href="http://example.com/1">लिंक 1</a>
<a href="http://example.com/2">लिंक 2</a>
</body>
</html>
"#;
let document = Html::parse_document(html);
let selector = Selector::parse("a").unwrap();
for element in document.select(&selector) {
let link = element.value().attr("href").unwrap();
println!("मिला लिंक: {}", link);
}
}
आउटपुट:
मिला लिंक: http://example.com/1
मिला लिंक: http://example.com/2
इस उदाहरण में, हम एक साधारण HTML दस्तावेज को पार्स करते हैं ताकि सभी <a>
तत्वों को खोज सकें और उनके href
गुणों को निकाल सकें, प्रभावी रूप से दस्तावेज़ में सभी लिंकों के URL प्रिंट करते हैं। scraper
लाइब्रेरी HTML पार्सिंग को सरल बनाती है और CSS सेलेक्टर्स का उपयोग करके विशेष तत्वों को चुनने में मदद करती है, जिससे यह रस्ट में वेब स्क्रेपिंग कार्यों के लिए एक प्रमुख साधन बन जाता है।