JavaScript:
HTML:n jäsentäminen

Kuinka:

Jäsennetään HTML DOMParser-API:n avulla JavaScriptissä.

const parser = new DOMParser();
const htmlString = `<p>Hello, world!</p>`;
const doc = parser.parseFromString(htmlString, 'text/html');
console.log(doc.body.textContent); // Tuloste: Hello, world!

Nyt, otetaan kiinni jotain spesifimpää, kuten elementti luokalla:

const htmlString = `<div><p class="greeting">Hello, again!</p></div>`;
const doc = parser.parseFromString(htmlString, 'text/html');
const greeting = doc.querySelector('.greeting').textContent;
console.log(greeting); // Tuloste: Hello, again!

Syväsukellus

HTML:n jäsennys on yhtä vanha kuin web. Aluksi se oli selainjuttu—selaimet jäsensivät HTML:n näyttääkseen web-sivuja. Ajan myötä ohjelmoijat tahtoivat päästä käsiksi tähän prosessiin, mikä johti APIeihin kuten DOMParser.

Vaihtoehtoja? Tietysti. Meillä on kirjastoja kuten jQuery ja työkaluja kuten BeautifulSoup Pythonille. Mutta JavaScriptin natiivi DOMParser on nopea ja sisäänrakennettu, ei tarvetta ylimääräisille kirjastoille.

Toteutuksen kannalta, kun jäsennät HTML:ää DOMParserin avulla, se luo Document-objektin. Ajattele sitä hierarkkisena mallina HTML:stäsi. Kun sinulla se on, voit navigoida ja manipuloida sitä juuri kuten normaalin web-sivun DOMin kanssa.

Tässä se juttu—jäsennys voi kompastua virheelliseen HTML:ään. Selaimet ovat anteeksiantavia, mutta DOMParser ei ehkä ole. Siksi, monimutkaisiin tehtäviin tai sekavaan HTML:ään, kolmannen osapuolen kirjastot saattavat tehdä parempaa siivousta.

Katso Myös