我使用网络收获来获取HTMLs,但是我发现我得到的和浏览器中的略有不同。html中的几个数字被一个破折号(-)替换成了用web采集爬行的HTML中的数字。
HTML的所有其他内容都是相同的。即使我用Java代码替换web采集的http语句来请求HTML,这仍然不起作用。
我保证我的浏览器中的URL和web采集中的http请求中的URL是相同的。我怎么才能让它工作呢?
发布于 2020-02-15 10:26:24
这个问题很常见,通常是CSS相关的内容有问题。主要原因有: 1、元素与网页源码不一致是最常见的现象。元素的代码已经由JS呈现。这是正常的,它是不同的。你可以查看Google首页的元素和源码,它们明显不同,如下图所示。ElementsView-Source这应该以网页源码为标准。2.异步问题。3.如果网页的源代码与爬虫的源代码不同,可能是由于反爬行的原因
https://stackoverflow.com/questions/25997336
复制相似问题