TypeScript:
HTML পার্স করা

কিভাবে:

শুরু করতে, node-html-parser এর মত একটি লাইব্রেরি ইন্সটল করুন। এই টার্মিনাল কমান্ডটি হলঃ

npm install node-html-parser

এখন, চলুন TypeScript এ কিছু বেসিক HTML পার্শিং করি:

import { parse } from 'node-html-parser';

const html = `<ul class="fruits">
                <li>Apple</li>
                <li>Banana</li>
              </ul>`;

const root = parse(html);
console.log(root.querySelector('.fruits').textContent);  // "Apple Banana"

এবং যদি আপনি শুধু কলাগুলো গ্রহণ করতে চান:

const bananas = root.querySelectorAll('li')[1].textContent;
console.log(bananas);  // "Banana"

গভীর ডাইভ

HTML পার্শিং নতুন কিছু নয় - এটি ওয়েবের প্রাথমিক দিনগুলি থেকেই চলে আসছে। প্রথমে, ডেভেলপাররা রেগুলার এক্সপ্রেশন ব্যবহার করতে পারে, কিন্তু তা দ্রুত জটিল হয়ে উঠেছিল। তারপর আসে DOM Parser: স্থিতিশীল, কিন্তু ব্রাউজার-বাধ্য।

node-html-parser এর মত লাইব্রেরিগুলি ব্যথা দূর করে। এগুলি আপনাকে jQuery এর মত করে HTML কৌড়ি দেয়, কিন্তু Node.js এর সাথে সার্ভার-সাইডে। এটি দ্রুত, নোংরা HTML এর প্রতি সহ্যশীল এবং DOM-বান্ধব।

এছাড়াও আছে jsdom, এটি একটি পূর্ণ ব্রাউজার পরিবেশ অনুকরণ করে। এটি ভারী কিন্তু আরো বিস্তৃত, ম্যানিপুলেশন এবং ইন্টারাকশনের জন্য একটি পূর্ণ Document Object Model (DOM) তৈরি করে।

Cheerio কেও ভুলা যায় না। এটি jQuery-এর মত সিনট্যাক্স এবং ছোট্ট ফুটপ্রিন্ট সহ গতি মিশ্রিত করে, দুটোর মাঝামাঝি সুখী ভাবে অবস্থান নেয়।

আরো দেখুন

আরও জানতে চাইলে, এখানে ডুব দিন: