首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >抓取的html与浏览器中的html不同

抓取的html与浏览器中的html不同
EN

Stack Overflow用户
提问于 2014-09-23 22:11:44
回答 1查看 67关注 0票数 1

我使用网络收获来获取HTMLs,但是我发现我得到的和浏览器中的略有不同。html中的几个数字被一个破折号(-)替换成了用web采集爬行的HTML中的数字。

HTML的所有其他内容都是相同的。即使我用Java代码替换web采集的http语句来请求HTML,这仍然不起作用。

我保证我的浏览器中的URL和web采集中的http请求中的URL是相同的。我怎么才能让它工作呢?

EN

回答 1

Stack Overflow用户

发布于 2020-02-15 10:26:24

这个问题很常见,通常是CSS相关的内容有问题。主要原因有: 1、元素与网页源码不一致是最常见的现象。元素的代码已经由JS呈现。这是正常的,它是不同的。你可以查看Google首页的元素和源码,它们明显不同,如下图所示。ElementsView-Source这应该以网页源码为标准。2.异步问题。3.如果网页的源代码与爬虫的源代码不同,可能是由于反爬行的原因

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25997336

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档