TypeScript:
HTML পার্স করা
কিভাবে:
শুরু করতে, node-html-parser
এর মত একটি লাইব্রেরি ইন্সটল করুন। এই টার্মিনাল কমান্ডটি হলঃ
npm install node-html-parser
এখন, চলুন TypeScript এ কিছু বেসিক HTML পার্শিং করি:
import { parse } from 'node-html-parser';
const html = `<ul class="fruits">
<li>Apple</li>
<li>Banana</li>
</ul>`;
const root = parse(html);
console.log(root.querySelector('.fruits').textContent); // "Apple Banana"
এবং যদি আপনি শুধু কলাগুলো গ্রহণ করতে চান:
const bananas = root.querySelectorAll('li')[1].textContent;
console.log(bananas); // "Banana"
গভীর ডাইভ
HTML পার্শিং নতুন কিছু নয় - এটি ওয়েবের প্রাথমিক দিনগুলি থেকেই চলে আসছে। প্রথমে, ডেভেলপাররা রেগুলার এক্সপ্রেশন ব্যবহার করতে পারে, কিন্তু তা দ্রুত জটিল হয়ে উঠেছিল। তারপর আসে DOM Parser: স্থিতিশীল, কিন্তু ব্রাউজার-বাধ্য।
node-html-parser
এর মত লাইব্রেরিগুলি ব্যথা দূর করে। এগুলি আপনাকে jQuery এর মত করে HTML কৌড়ি দেয়, কিন্তু Node.js এর সাথে সার্ভার-সাইডে। এটি দ্রুত, নোংরা HTML এর প্রতি সহ্যশীল এবং DOM-বান্ধব।
এছাড়াও আছে jsdom
, এটি একটি পূর্ণ ব্রাউজার পরিবেশ অনুকরণ করে। এটি ভারী কিন্তু আরো বিস্তৃত, ম্যানিপুলেশন এবং ইন্টারাকশনের জন্য একটি পূর্ণ Document Object Model (DOM) তৈরি করে।
Cheerio কেও ভুলা যায় না। এটি jQuery-এর মত সিনট্যাক্স এবং ছোট্ট ফুটপ্রিন্ট সহ গতি মিশ্রিত করে, দুটোর মাঝামাঝি সুখী ভাবে অবস্থান নেয়।
আরো দেখুন
আরও জানতে চাইলে, এখানে ডুব দিন: