TypeScript:
Разбор HTML
Как это сделать:
Чтобы начать, установите библиотеку, например, node-html-parser
. Вот команда для терминала:
npm install node-html-parser
Теперь давайте разберем некоторый базовый HTML в TypeScript:
import { parse } from 'node-html-parser';
const html = `<ul class="fruits">
<li>Яблоко</li>
<li>Банан</li>
</ul>`;
const root = parse(html);
console.log(root.querySelector('.fruits').textContent); // "Яблоко Банан"
И если вы хотите выбрать только бананы:
const bananas = root.querySelectorAll('li')[1].textContent;
console.log(bananas); // "Банан"
Глубокое Погружение
Разбор HTML не новость – он существует с начала дней веба. Изначально разработчики могли использовать регулярные выражения, но это быстро становилось запутанным. Вот тут-то и появился DOM Parser: стабильный, но ограниченный браузером.
Библиотеки вроде node-html-parser
избавляют от боли. Они позволяют вам запрашивать HTML, как вы бы сделали это с jQuery, но на стороне сервера с Node.js. Это быстро, терпимо к “грязному” HTML и дружелюбно к DOM.
Есть также jsdom
, симулирующий целое браузерное окружение. Оно тяжелее, но более тщательное, создавая полноценную Документную Объектную Модель (DOM) для манипуляции и взаимодействия.
Не забудем и про Cheerio. Она сочетает в себе скорость с синтаксисом, похожим на jQuery, и меньшим объемом, удобно располагаясь между двумя другими.
Смотрите Также
Если вам интересно узнать больше, загляните сюда: