我正在尝试使用Goutte来抓取网页,但是我找不到DOMCrawler方法来搜索实际的文本。假设有一个标题,但它没有类或ID,因此,我需要搜索“td”,然后获取该td的下一个兄弟项。
发布于 2015-03-24 10:48:01
首先,我想向您推荐有关Node Filtering的DomCrawlers文档,特别是DomCrawler::reduce()方法和Accessing Node Values
如果您对访问这些内容不满意,那么您可以随时下拉并使用DOMNode properties
当然,使用功能非常强大的XPath查询可能会更好。
https://stackoverflow.com/questions/29222032
复制相似问题