TypeScript:
Análise de HTML

Como Fazer:

Para analisar HTML em TypeScript, você pode usar a biblioteca node-html-parser. Aqui está um exemplo de código simples para começar:

import { parse } from 'node-html-parser';

// Exemplo de HTML para analisar
const html = `<ul class="frutas">
  <li>Maçã</li>
  <li>Banana</li>
  <li>Laranja</li>
</ul>`;

// Analisando o HTML
const root = parse(html);

// Acessando elementos
const frutas = root.querySelectorAll('li').map(ele => ele.innerText);
console.log(frutas);

Saída esperada:

[ 'Maçã', 'Banana', 'Laranja' ]

Mergulho Profundo

O ato de analisar HTML existe desde o início da web, permitindo que servidores e clientes comunicassem conteúdo dinâmico. Hoje, além do node-html-parser, existem outras bibliotecas como Cheerio ou jsdom, cada uma com suas peculiaridades e casos de uso específicos.

O node-html-parser é leve e rápido, mas não simula um navegador real, então é melhor para análise de HTML estático. Cheerio oferece uma API similar ao jQuery, o que pode ser conveniente para quem já conhece jQuery. Já jsdom é mais pesado, mas pode simular um ambiente de navegador inteiro, com suporte a eventos e interações mais complexas.

Detalhes importantes ao analisar HTML incluem lidar com HTML mal formado e evitar ataques de injeção de scripts.

Veja Também