PHP:
Tolka HTML

Hur man gör:

För att tolka HTML kan PHP-programmerare använda inbyggda funktioner eller luta sig mot robusta bibliotek som Simple HTML DOM Parser. Här kommer vi att utforska exempel med användning av både PHP:s DOMDocument och Simple HTML DOM Parser.

Använda DOMDocument:

PHP:s DOMDocument-klass är en del av dess DOM-tillägg, som tillåter tolkning och manipulering av HTML- och XML-dokument. Här är ett snabbt exempel på hur man använder DOMDocument för att hitta alla bilder i ett HTML-dokument:

$html = <<<HTML
<!DOCTYPE html>
<html>
<head>
    <title>Exempelsida</title>
</head>
<body>
    <img src="image1.jpg" alt="Bild 1">
    <img src="image2.jpg" alt="Bild 2">
</body>
</html>
HTML;

$doc = new DOMDocument();
@$doc->loadHTML($html);
$images = $doc->getElementsByTagName('img');

foreach ($images as $img) {
    echo $img->getAttribute('src') . "\n";
}

Exempel på utmatning:

image1.jpg
image2.jpg

Använda Simple HTML DOM Parser:

För mer komplexa uppgifter eller enklare syntax kan du föredra att använda ett tredjepartsbibliotek. Simple HTML DOM Parser är ett populärt val som erbjuder ett jQuery-liknande gränssnitt för att navigera och manipulera HTML-strukturer. Så här använder du det:

Installera först biblioteket med Composer:

composer require simple-html-dom/simple-html-dom

Därefter, manipulera HTML för att till exempel hitta alla länkar:

require_once 'vendor/autoload.php';

use simplehtmldom\HtmlWeb;

$client = new HtmlWeb();
$html = $client->load('http://www.example.com');

foreach($html->find('a') as $element) {
    echo $element->href . "\n";
}

Denna kodsnutt kommer att hämta HTML-innehållet för ‘http://www.example.com’, tolka det, och skriva ut alla hyperlänkar. Kom ihåg att ersätta 'http://www.example.com' med den faktiska URL du önskar tolka.

Genom att använda dessa metoder kan PHP-utvecklare effektivt tolka HTML-innehåll, anpassa dataextrahering till sina behov eller sömlöst integrera externt webbinnehåll i sina projekt.