我想列出我的web应用程序中出现的所有单词。我已经看到的地方很少是HTML页面,代码文件,数据库,上传的文档,图像,视频。请给我建议一下我应该去的其他地方,那个词会出现在哪里。我知道爬虫可以用于这个任务,但如果任何人在过去有同样的经验,那么请建议一些好的自动化工具,可以很容易地在网站上找到这个词。
发布于 2014-03-10 04:44:35
因为文件是本地的,我觉得你不需要爬虫。你只需要搜索这些文件。
正如我在评论中所说的,操作系统本身应该能够找到大多数事件。
程序确认应该能够做你想做的事情。它是用Perl编写的,因此它完全可移植到Windows。这里是Windows上的所以关于安装它的问题。这将适用于所有HTML文件和源代码。
一些注意事项:
https://stackoverflow.com/questions/22291978
复制相似问题