Kotlin:
HTML विश्लेषण

कैसे करें:

Kotlin में Jsoup जैसे लाइब्रेरीज की मदद से HTML पार्सिंग सीधी हो जाती है। यहां बताया गया है कि आप यह कैसे कर सकते हैं:

import org.jsoup.Jsoup

fun main() {
    val html = "<html><head><title>Sample Page</title></head><body><p>यह एक परीक्षण है।</p></body></html>"
    val doc = Jsoup.parse(html)

    val title = doc.title()
    println("Title: $title")  // परिणाम: Title: Sample Page

    val pText = doc.select("p").first()?.text()
    println("Paragraph: $pText")  // परिणाम: Paragraph: यह एक परीक्षण है।
}

हमने शीर्षक और पैराग्राफ टेक्स्ट लिया, जो Jsoup के सक्षम होने की सामान्य जानकारी प्रदान करता है। लेकिन यह एक शुरूआत है।

गहराई में जाएँ:

Kotlin से पहले, इसके लिए Java मुख्यतः उपयोग होता था, अक्सर अजीब तरीके से। Jsoup ने स्क्रिप्ट को पलट दिया, jQuery जैसे दृष्टिकोण प्रदान करके। हालाँकि, HTML पार्सिंग केवल Jsoup तक ही सीमित नहीं है; HtmlUnit जैसी अन्य लाइब्रेरीज या यहाँ तक कि रेगेक्स (हालाँकि इसकी सलाह नहीं दी जाती) भी मौजूद हैं। Jsoup के साथ, आप सुनिश्चित करते हैं कि आपकी पार्सिंग दस्तावेज़ की संरचना का सम्मान करती है। यह एक DOM मॉडल का उपयोग करता है, जो तत्वों का चयन और हेरफेर को सक्षम बनाता है। यह लचीला भी है— यह सबसे अधिक गन्दे HTML को भी पार्स कर सकता है।

देखें भी:

Jsoup में गहराई से जाने के लिए:

वेब स्क्रेपिंग और पार्सिंग पर व्यापक चर्चाओं और ट्यूटोरियल्स के लिए: