首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >通过屏幕抓取从浏览器获取数据

通过屏幕抓取从浏览器获取数据
EN

Stack Overflow用户
提问于 2012-11-15 02:38:51
回答 3查看 2.8K关注 0票数 2

我已经通过了几个相关的外观问题,但它们没有包含我正在寻找的答案。所以,我的问题是:

我在我的工作场所有几个web应用程序,它们是使用不同的框架编写的,并且作者很久以前就要求进行功能更新。因此,我每天都要经历相同的令人精疲力竭的操作序列,这相当于几千字节的文件大小。

我试着解析页面源代码,但作者的编程技术无处不在。有些人甚至故意隐藏代码,不让数据显示为文本,这是没有理由的,因为他们编写的代码是公司资产。长话短说,我意识到如果我可以复制和粘贴这些页面的文本内容,我就可以处理这些数据,而不是解析页面源代码来获得文本(这有时是完全不可能的)。

因此,我现在正在寻找一个浏览器插件(在windows或linux环境中)或类似的基于文本的工具在windows或linux上,它将加载这些页面,并在调用时将屏幕上的文本保存到文件中。

不管我怎么努力,我还是两手空空。

我不想使用第三方抓屏网站的服务,因为这些数据是公司机密的,外部人士无法访问。一切都必须发生在客户端,因为我没有访问这些应用程序正在运行的服务器(主要是windows前端的IIS和后端的oracle数据库)。正如我之前解释过的,中间层是任何人都在胡乱猜测的,从原生oracle应用程序到weblogic再到tomcat,再到一些内部开发的java/javascript东西。

提前感谢大家的帮助

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2014-02-20 01:40:59

在寻找了一年多的时间后,我开始意识到,只要我使用windows,它的一个现代版本,即自动热键,就是我的救星。

我打开网页,最大化它,放置光标(mousemove,x,y),然后左键单击(mouseclick,L),然后按ctrl-A和ctrl-C。

瞧!一切都在剪贴板上。然后我激活unix会话(winactivate PuTTY)并发送相应的按键命令以启动我选择的编辑器(即vi),最后发送shift-Insert组合键将剪贴板粘贴到我的文档中。然后保存并退出。

作为额外的好处,在我的文档被保存之后,我可以立即调用我选择的脚本来解析这个文件,并返回我感兴趣的部分。

我知道它不是防弹的,但对我来说,它在很大程度上有帮助。事实上,我可以用这个方法做任何我想做的事情。

票数 1
EN

Stack Overflow用户

发布于 2012-11-15 02:41:49

像这样的东西怎么样:将http://www.nirsoft.net/utils/htmlastext.html页面转换为文本的免费软件

票数 0
EN

Stack Overflow用户

发布于 2012-11-16 07:56:51

任何链接,lynx或w3m都可以做你想做的事情,它们是文本浏览器,你可以从网页上转储文本,例如:

代码语言:javascript
复制
w3m -dump http://www.google.com > g.txt
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/13385146

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档