我会有一个页面web应用程序,它使用两个查询项来控制显示给用户的内容以及目标类型的散列片段,这样可以防止在哈希中对查询项进行编码。一个示例链接:
https://example.com/page?foo=1&bar=2&baz=3#target
我的理解是,对于foo、bar和baz的每一个值组合,Wayback机器都会尝试存储页面的不同版本.这对单个页面应用程序来说有点浪费存储空间,并且可能导致这些参数的某些组合的覆盖范围缺失。
我想知道我是否可以使用<link rel="canonical" href="https://example.com/page" />来告诉Wayback机器忽略页面的所有变体,如果是这样的话,当请求https://example.com/page?foo=1&bar=2&baz=3时,我会得到其他的东西吗?
或者不是使用foo、bar和baz,而是在爬行和请求过程中Wayback机器会忽略其他查询术语名称吗?
发布于 2023-03-04 04:05:25
Wayback Machine将存档查询字符串和备用URL,不管规范是什么。例如,关于堆栈溢出的最高投票问题 (“stackoverflow.com. for /q/11227809”)已在43 (或更多)不同的网址)上存档,其中包括一个额外的段(“stackoverflow.com.for/q/11227809/#”)和查询字符串(“stackoverflow.com.com/q/11227809?lq=1”)。规范的URL是带有标题段塞的URL。
空间并不重要(这甚至不是你的空间!)我只是建议允许保存您的URL的所有变化,因为这是最友好的用户。
https://webmasters.stackexchange.com/questions/141765
复制相似问题