Clojure:
HTML পার্স করা
কিভাবে:
Clojure-এ HTML পার্সিং এর জন্য কোনো নির্মিত ক্ষমতা নেই, কিন্তু আপনি Java লাইব্রেরিগুলো বা Clojure র্যাপার যেমন enlive
বা hickory
ব্যবহার করে এটা করতে পারেন। এখানে উভয়ের ব্যবহার কিভাবে করবেন তা দেওয়া হলঃ
Enlive ব্যবহার করে:
Enlive HTML পার্স এবং ওয়েব স্ক্রেপিং এর জন্য একটি জনপ্রিয় পছন্দ। প্রথমে, আপনার প্রজেক্ট নির্ভরতায় এটি যোগ করুন:
[net.cgrand/enlive "1.1.6"]
তারপর, HTML পার্স এবং নেভিগেট করা যাবে এরকম:
(require '[net.cgrand.enlive-html :as html])
(let [doc (html/html-resource (java.net.URL. "http://example.com"))]
(html/select doc [:div.some-class]))
এই স্নিপেট একটি HTML পাতা ফেচ করে এবং some-class
ক্লাস সহ সব <div>
এলিমেন্ট নির্বাচন করে।
আউটপুট হতে পারে:
({:tag :div, :attrs {:class "some-class"}, :content ["Here's some content."]})
Hickory ব্যবহার করে:
Hickory Clojure-এ কাজ করার জন্য আরো সহজ ফরম্যাটে HTML পার্স করার একটি উপায় প্রদান করে। Hickory আপনার প্রজেক্ট নির্ভরতায় যোগ করুন:
[hickory "0.7.1"]
এখানে একটি সহজ উদাহরণ দেওয়া হচ্ছে:
(require '[hickory.core :as hickory]
'[hickory.select :as select])
;; HTML কে Hickory ফর্ম্যাটে পার্স করুন
(let [doc (hickory/parse "<html><body><div id='main'>Hello, world!</div></body></html>")]
;; 'main' id সহ div নির্বাচন করুন
(select/select (select/id "main") doc))
এই কোড একটি সাধারণ HTML স্ট্রিং পার্স করে এবং main
ID সহ একটি div
খুঁজে পায়।
নমুনা আউটপুট:
[{:type :element, :tag :div, :attrs {:id "main"}, :content ["Hello, world!"]}]
enlive
এবং hickory
উভয়ই Clojure-এ HTML পার্সিং এর জন্য শক্তিশালী সমাধান প্রস্তাব করে, enlive
টেমপ্লেটিং এর উপর এবং hickory
ডেটা ট্রান্সফরমেশন এর উপর জোর দেয়।