我想在我的web应用上建立一个教育搜索引擎,所以我决定使用PHP从我的网页上抓取大约10个网站,并将数据存储到我的数据库中以供以后搜索。如何检索此数据并将其存储在数据库中?
发布于 2011-05-07 10:01:34
你可以用file_get_contents()函数抓取它们。所以你就会有
$homepage = file_get_contents('http://www.example.com/homepage');此函数用于将页面返回为字符串。
希望这能有所帮助。干杯
发布于 2011-05-07 10:06:20
建立一个爬虫,我会使URL列表,以获取,并最终获得它们
A.让列表成为
为此,您可以使用这个类,它使得解析html非常容易:http://simplehtmldom.sourceforge.net/
B.获取content
对生成的数组进行循环,并获取内容。file_get_contents将为您做这件事:http://www.php.net/manual/fr/function.file-get-contents.php
这对于一个开始来说基本上是有效的,在步骤A中,你应该保留一个已经解析的URL的列表,以便只检查一个URL。查询字符串也可以是您关注的东西,以避免使用不同的查询字符串扫描多个页面。
https://stackoverflow.com/questions/5918646
复制相似问题