我有一个HTML
<div class="news">
<h3 class="border-bottom">标题2</h3>
<p class="mt-0 ml-1">2023-04-01</p>
<img src="20230401.jpg" class="w-50 float-right ml-2">
<p class="lead"><p>说明2</p></p>
<a href="https://.../news/245" class="btn btn-secondary">阅读更多内容</a>
</div>
<div class="news">
<h3 class="border-bottom">标题1</h3>
<p class="mt-0 ml-1">2023-03-31</p>
<img src="20230331.jpg" class="w-50 float-right ml-2">
<p class="lead"><p>说明1</p></p>
<a href="https://.../news/244" class="btn btn-secondary">阅读更多内容</a>
</div>
我想提取每个项目的标题和日期.我试过这个了
$class = "news";
$dom = new DOMDocument();
$dom->loadHTML($html);
$a = new DOMXPath($dom);
$divs = $a->query("//*[contains(concat(' ', normalize-space(@class), ' '), ' $class ')]");
foreach ($divs as $link) {
print_r($link->nodeValue);
}
但它表明:
标题2
2023-04-01
说明2
阅读更多内容
标题1
2023-03-31
说明1
阅读更多内容
我被困住了,想不出怎么解压