列表采集 怎么匹配range后紧跟的链接?
问题描述
采集到的代码如下
<div class="page">
<span>共8页: </span>
<a href="xxx">上一页</a>
<a href="xxx">1</a>
<a href="xxx">2</a>
<a href="xxx">3</a>
<a href="xxx">4</a>
<a href="xxx">5</a>
<a href="xxx">6</a>
<a href="xxx">7</a>
<a href="xxx">8</a>
<span href="xxx">下一页</span>
</div>
如何代码匹配href链接
相关代码
<?php
$rules = [
'url' => ['a', 'href']
];
$list = QueryList::get($url, null, [
'headers' => [
'User-Agent' => 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36',
'Accept-Encoding' => 'gzip, deflate, br',
]
])->rules($rules)
->range('.pagebox>a')
->queryData();
var_dump($list);
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论