Kotlin:
HTML পার্স করা

কিভাবে:

Kotlin জসুপের মতো লাইব্রেরিগুলির সাথে HTML পার্সিং সরল করে তোলে। এটা কিভাবে করবেন তা নিচে দেওয়া হল:

import org.jsoup.Jsoup

fun main() {
    val html = "<html><head><title>Sample Page</title></head><body><p>This is a test.</p></body></html>"
    val doc = Jsoup.parse(html)

    val title = doc.title()
    println("Title: $title")  // আউটপুট: Title: Sample Page

    val pText = doc.select("p").first()?.text()
    println("Paragraph: $pText")  // আউটপুট: Paragraph: This is a test.
}

আমরা এর শিরোনাম এবং প্যারাগ্রাফের টেক্সট ধারণ করি, যা জসুপ কি করতে পারে তার খুব ভাসা ভাসা একটি ধারণা। কিন্তু এটা একটি শুরু।

গভীর ডুব:

Kotlin এর আগে, এই কাজের জন্য Java ছিল প্রধান নির্বাচন, প্রায় অসুবিধাজনকভাবে। Jsoup কাহিনীটি পাল্টে দিয়েছে jQuery-এর মতো দৃষ্টিভঙ্গি প্রদান করে। HTML পার্সিং শুধুমাত্র Jsoup দ্বারা সীমাবদ্ধ নয়; HtmlUnit অথবা এমনকি regex (যদিও বিরুদ্ধে পরামর্শ দেওয়া হয়) মতো অন্যান্য লাইব্রেরিও বিদ্যমান। Jsoup এর সাথে, আপনি নিশ্চিত করতে পারেন যে আপনার পার্সিং ডকুমেন্টের কাঠামো সন্মান করে। এটি একটি DOM মডেল ব্যবহার করে, যা উপাদানগুলি নির্বাচন এবং ম্যানিপুলেশন সম্ভব করে তোলে। এটি একটি দৃঢ় লাইব্রেরি, এমনকি সবচেয়ে জটিল HTML পার্স করতে সক্ষম।

আরও দেখুন:

Jsoup সম্পর্কে গভীরে ডুব দিন:

ওয়েব স্ক্র্যাপিং এবং পার্সিং সম্পর্কে ব্যাপক আলোচনা ও টিউটোরিয়ালের জন্য: