我试图创建一个web应用程序,用户可以选择一个电影的名称(前)。(“空中坠落”)从下拉列表。然后,我想执行一个爬虫到rottentomatoes.com并获取与这部电影相关的所有html页面。我已经使用Tomcat在Eclipse中创建了我的web应用程序( GUI)。我有一个web爬虫: crawler4j,如果我选择将主.java文件作为应用程序运行,它就会运行。我怎么才能把这两者结合起来?
发布于 2013-01-18 11:44:25
正如Marvo在评论中所建议的那样,我通过实现一个激活爬虫的Servlet来解决这个问题。
发布于 2012-12-10 23:22:54
您可以使用美汤,我一直使用它从其他站点获取内容。
或者,您也可以使用HtmlUnit
https://stackoverflow.com/questions/13809155
复制相似问题