首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >统计网站的超链接

统计网站的超链接
EN

Stack Overflow用户
提问于 2011-09-29 14:53:44
回答 3查看 962关注 0票数 2

可能重复:

How to parse HTML with PHP?

我想写一个php程序,计数一个网站的所有超链接,用户可以进入。

怎么做?是否有一个libary或者什么东西可以解析和分析有关超链接的html?

谢谢你的帮忙

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-09-29 14:58:07

像这样

代码语言:javascript
复制
<?php
$site  = file_get_contents("someurl");
$links = substr_count($site, "<a href=");
print"There is {$links} in that page.";
?>
票数 1
EN

Stack Overflow用户

发布于 2011-09-29 15:00:53

好吧,我们不能给你一个有限的答案,但只能给你指点。我在php之外做了一次搜索引擎,所以原理是一样的:

首先,您需要将脚本编码为控制台脚本,web脚本并不合适,但这都是一个品味问题,您需要了解如何使用PHP中的套接字并发出请求,查看http://www.php.net/manual/ref.network.php

  • You套接字库:需要熟悉HTTP请求的世界,了解如何发出自己的GET/POST请求,以及如何将头从返回的内容中分离出来。使用regexp,
  1. 的最后一部分将很容易。只需preg_match "#()*#i“的内容(最后一个表达式可能是错误的,我根本没有测试它?)
  2. 循环找到的href列表,与已经访问过的hrefs相比(请记住在您的文章中考虑通配符GET params ),然后重复这个过程加载站点的所有页面。

这是艰苦的工作..。祝好运

票数 0
EN

Stack Overflow用户

发布于 2011-09-29 15:00:11

您可能必须使用卷曲,以fetech的内容的网页。将其存储在变量中,然后将其解析为超链接。为此您可能需要正则表达式。

票数 -2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/7599205

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档