我已经通过了几个相关的外观问题,但它们没有包含我正在寻找的答案。所以,我的问题是:
我在我的工作场所有几个web应用程序,它们是使用不同的框架编写的,并且作者很久以前就要求进行功能更新。因此,我每天都要经历相同的令人精疲力竭的操作序列,这相当于几千字节的文件大小。
我试着解析页面源代码,但作者的编程技术无处不在。有些人甚至故意隐藏代码,不让数据显示为文本,这是没有理由的,因为他们编写的代码是公司资产。长话短说,我意识到如果我可以复制和粘贴这些页面的文本内容,我就可以处理这些数据,而不是解析页面源代码来获得文本(这有时是完全不可能的)。
因此,我现在正在寻找一个浏览器插件(在windows或linux环境中)或类似的基于文本的工具在windows或linux上,它将加载这些页面,并在调用时将屏幕上的文本保存到文件中。
不管我怎么努力,我还是两手空空。
我不想使用第三方抓屏网站的服务,因为这些数据是公司机密的,外部人士无法访问。一切都必须发生在客户端,因为我没有访问这些应用程序正在运行的服务器(主要是windows前端的IIS和后端的oracle数据库)。正如我之前解释过的,中间层是任何人都在胡乱猜测的,从原生oracle应用程序到weblogic再到tomcat,再到一些内部开发的java/javascript东西。
提前感谢大家的帮助
发布于 2014-02-20 01:40:59
在寻找了一年多的时间后,我开始意识到,只要我使用windows,它的一个现代版本,即自动热键,就是我的救星。
我打开网页,最大化它,放置光标(mousemove,x,y),然后左键单击(mouseclick,L),然后按ctrl-A和ctrl-C。
瞧!一切都在剪贴板上。然后我激活unix会话(winactivate PuTTY)并发送相应的按键命令以启动我选择的编辑器(即vi),最后发送shift-Insert组合键将剪贴板粘贴到我的文档中。然后保存并退出。
作为额外的好处,在我的文档被保存之后,我可以立即调用我选择的脚本来解析这个文件,并返回我感兴趣的部分。
我知道它不是防弹的,但对我来说,它在很大程度上有帮助。事实上,我可以用这个方法做任何我想做的事情。
发布于 2012-11-15 02:41:49
像这样的东西怎么样:将http://www.nirsoft.net/utils/htmlastext.html页面转换为文本的免费软件
发布于 2012-11-16 07:56:51
任何链接,lynx或w3m都可以做你想做的事情,它们是文本浏览器,你可以从网页上转储文本,例如:
w3m -dump http://www.google.com > g.txthttps://stackoverflow.com/questions/13385146
复制相似问题