Clojure:
HTML विश्लेषण
कैसे करें:
Clojure में HTML पार्सिंग की कोई निर्मित क्षमता नहीं है, लेकिन आप Java लाइब्रेरीज़ या Clojure रैपर जैसे कि enlive
या hickory
का उपयोग कर सकते हैं। यहाँ दोनों का उपयोग कैसे करें:
Enlive का उपयोग करके:
Enlive HTML पार्सिंग और वेब स्क्रैपिंग के लिए लोकप्रिय विकल्प है। पहले, इसे अपनी परियोजना निर्भरताओं में शामिल करें:
[net.cgrand/enlive "1.1.6"]
फिर, आप HTML को इस तरह पार्स और नेविगेट कर सकते हैं:
(require '[net.cgrand.enlive-html :as html])
(let [doc (html/html-resource (java.net.URL. "http://example.com"))]
(html/select doc [:div.some-class]))
यह स्निपेट एक HTML पेज को लाता है और क्लास some-class
के साथ सभी <div>
तत्वों को चुनता है।
आउटपुट इस तरह दिखाई दे सकता है:
({:tag :div, :attrs {:class "some-class"}, :content ["Here's some content."]})
Hickory का उपयोग करके:
Hickory Clojure में काम करने के लिए आसान एक प्रारूप में HTML को पार्स करने का तरीका प्रदान करती है। अपनी परियोजना निर्भरताओं में Hickory जोड़ें:
[hickory "0.7.1"]
यहाँ एक सरल उदाहरण है:
(require '[hickory.core :as hickory]
'[hickory.select :as select])
;; HTML को Hickory प्रारूप में पार्स करें
(let [doc (hickory/parse "<html><body><div id='main'>Hello, world!</div></body></html>")]
;; id 'main' वाले डिव का चयन करें
(select/select (select/id "main") doc))
यह कोड एक सरल HTML स्ट्रिंग को पार्स करता है और ID main
वाले एक div
को ढूँढने के लिए एक CSS सेलेक्टर का उपयोग करता है।
उदाहरण आउटपुट:
[{:type :element, :tag :div, :attrs {:id "main"}, :content ["Hello, world!"]}]
enlive
और hickory
दोनों Clojure में HTML पार्सिंग के लिए शक्तिशाली समाधान प्रदान करते हैं, enlive
अधिक टेम्पलेटिंग पर ध्यान केंद्रित करता है और hickory
डेटा परिवर्तन पर जोर देता है।