Kotlin:
Analizando HTML

Cómo hacerlo:

Kotlin facilita el análisis de HTML con bibliotecas como Jsoup. Aquí te mostramos cómo hacerlo:

import org.jsoup.Jsoup

fun main() {
    val html = "<html><head><title>Página de Ejemplo</title></head><body><p>Esto es una prueba.</p></body></html>"
    val doc = Jsoup.parse(html)

    val title = doc.title()
    println("Título: $title")  // Salida: Título: Página de Ejemplo

    val pText = doc.select("p").first()?.text()
    println("Párrafo: $pText")  // Salida: Párrafo: Esto es una prueba.
}

Tomamos el título y el texto del párrafo, apenas rozando la superficie de lo que Jsoup puede hacer. Pero es un comienzo.

Profundizando:

Antes de Kotlin, Java era la opción predilecta para esto, a menudo de manera torpe. Jsoup cambió el juego ofreciendo un enfoque al estilo jQuery. Sin embargo, analizar HTML no es exclusivo de Jsoup; existen otras bibliotecas como HtmlUnit o incluso regex (aunque se desaconseja). Con Jsoup, te aseguras de que tu análisis respete la estructura del documento. Utiliza un modelo DOM, lo que permite la selección y manipulación de elementos. También es resistente: puede analizar incluso el HTML más desordenado.

Ver También:

Profundiza en Jsoup:

Para discusiones más amplias y tutoriales sobre web scraping y análisis: