我正在构建一个网络爬虫,我试图弄清楚网页是从哪里来的。我的意思是,我可以检查域名(例如,来自阿根廷的.com.ar ar ),但还有其他网站,有其他的域名(.com,.net)也是阿根廷的,www.taringa.net就是一个例子。是一个阿根廷站点,但具有.net域。
那么我该怎么做呢?
谢谢。
发布于 2011-02-09 06:32:37
但请记住,“网页来自哪里”没有任何意义。网络没有地理上的界限。我可以运行出圣何塞加利福尼亚州的西班牙语网站,并在加拿大注册域名联系人。你将无法知道我的网站是针对智利用户的。
发布于 2011-02-09 06:33:11
您可以在命令行上使用whois查询-或者根据结果向whois.arin.net和whois.xxxx.xxx发出请求。如果我将www.taringa.net映射到一个IP,我会得到如下结果:
www.taringa.net. 300 IN A 190.210.132.53然后在上面运行whois:
whois 190.210.132.53给了我大量的输出:
inetnum: 190.210.132/24
status: reallocated
owner: WIROOS SRL
ownerid: AR-WISR1-LACNIC
responsible: ALBERTO NAKAYAMA
address: GRAL MIGUEL DE AZCUENAGA, 71, 4 A
address: C1029AAA - BUENOS AIRES -
country: AR
phone: +54 011 30973059 [3059]这通常适用于任何ip。
https://stackoverflow.com/questions/4939214
复制相似问题