这是我的第一个问题,所以我会尽我最大的努力。
我正在尝试从一堆域获取协议和FQDN (完全限定域名),即从https://es.aliexpress.com获得aliexpress.com。我已经尝试过Selenium,但是计算所有域(即使是短超时和阻塞图像)花费的时间太长了。
我想问的是,是否有人知道在不加载内容的情况下这样做,比如wget,但只针对URL。
感谢您的阅读。
发布于 2019-02-19 22:39:39
不太..。
首先,http和https与域名无关。那些是传输协议。
忽略该部分,您所称的FQDN通常是在您访问FQDN时生成的。
例如,许多网站根据用户代理字符串将浏览器从桌面站点重定向到移动版本(典型的m.something.com)。这意味着www.something.com和m.something.com都是有效的答案。
在您给出的示例中,aliexpress.com,预置es.,这意味着服务器上很可能有一些代码在您的位置(基于IP地址)或浏览器中的区域设置中读取,以引导您指向网站的es版本,而不是en或dk版本。
这些更改可以通过网站根文件夹中的.htaccess文件完成,也可以通过后端代码完成。
Google本身自动尝试添加www.,如果看起来您在everything栏中键入了一个URL。
URL也有可能是一个巨大的重定向。一些网站购买额外的域名,所有重定向到他们的核心网站。因此,即使您输入了xyz.com,您也会以abcd.com结束。
从基本URL到您所称的FQDN没有算法方法。
P.S. https://kb.iu.edu/d/aiuv关于FQDN的含义。
https://stackoverflow.com/questions/54774489
复制相似问题