我正在尝试创建一个脚本来检测给定的URL是否指向Joomla网站。
到目前为止,我有:
def is_joomla(url):
manifest = url + '/administrator/manifests/files/joomla.xml'
# get XML
if "joomla" in XML: # simplified
return True
return False另一个选择是用小写的html检查Joomla字符串,但这是不可靠的。我知道一些Joomla页面不能被检测到,但大多数应该被检测到。
有没有其他迹象可以帮助我检测出是不是Joomla?我不关心版本。
发布于 2017-07-28 15:52:01
我会检查不同的点,以确保您正在爬行的页面是joomla站点。
<meta name="generator" content="Joomla! - Open Source Content Management" />我认为如果选项1和3返回true,您可以非常确定爬行的页面是一个joomla站点。选项2是不保存,因为有些人可能会删除那里的robots.txt。
发布于 2017-07-28 17:13:13
你可以通过简单地检查网站的响应代码( X-CF-Powered- by )来看到一个网站正在运行Joomla,下面是一个示例:
Antwort HTTP/1.1 200 OK
Date Fri, 28 Jul 2017 09:02:35 GMT
Content-Type text/html; charset=utf-8
Transfer-Encoding chunked
X-CF-Powered-By CF-Joomla 0.1.5
P3P CP="NOI ADM DEV PSAi COM NAV OUR OTRo STP IND DEM"
Expires Wed, 02 Aug 2017 09:02:35 GMThttps://stackoverflow.com/questions/45359730
复制相似问题