TypeScript:
Разбор HTML

Как это сделать:

Чтобы начать, установите библиотеку, например, node-html-parser. Вот команда для терминала:

npm install node-html-parser

Теперь давайте разберем некоторый базовый HTML в TypeScript:

import { parse } from 'node-html-parser';

const html = `<ul class="fruits">
                <li>Яблоко</li>
                <li>Банан</li>
              </ul>`;

const root = parse(html);
console.log(root.querySelector('.fruits').textContent);  // "Яблоко Банан"

И если вы хотите выбрать только бананы:

const bananas = root.querySelectorAll('li')[1].textContent;
console.log(bananas);  // "Банан"

Глубокое Погружение

Разбор HTML не новость – он существует с начала дней веба. Изначально разработчики могли использовать регулярные выражения, но это быстро становилось запутанным. Вот тут-то и появился DOM Parser: стабильный, но ограниченный браузером.

Библиотеки вроде node-html-parser избавляют от боли. Они позволяют вам запрашивать HTML, как вы бы сделали это с jQuery, но на стороне сервера с Node.js. Это быстро, терпимо к “грязному” HTML и дружелюбно к DOM.

Есть также jsdom, симулирующий целое браузерное окружение. Оно тяжелее, но более тщательное, создавая полноценную Документную Объектную Модель (DOM) для манипуляции и взаимодействия.

Не забудем и про Cheerio. Она сочетает в себе скорость с синтаксисом, похожим на jQuery, и меньшим объемом, удобно располагаясь между двумя другими.

Смотрите Также

Если вам интересно узнать больше, загляните сюда: