我需要创建一个Java应用程序(部分创建),它需要像这样删除tripadvisor网页上的所有评论:http://www.tripadvisor.com/Hotel_Review-g187323-d233869-Reviews-or10-Hotel_Delta-Berlin.html
我对web-harverst非常陌生,所以现在我看到了这个未扩展文本的问题。要查看完整版本的评论,需要单击"More"-link,如下所示:
<span class="taLnk hvrIE6 tr162902990 moreLink ulBlueLinks" onclick="ta.util.cookie.setPIDCookie(2247);ta.call('ta.servlet.Reviews.expandReviews',event,this,'review_162902990', '1', 2247)"> More </span>因此,它运行一个脚本,并可能请求一个数据库。我的问题是:有没有可能在Java语言中模拟这个“更多”的-clicking操作?或者是获取全文的另一种方式?哪个库可以帮到我?
提前谢谢你。
发布于 2014-10-05 22:47:06
看起来HtmlUnit确实可以做到这一点。但我仍然有困难:https://stackoverflow.com/questions/26203701/htmlunit-to-expand-reviews
https://stackoverflow.com/questions/26159114
复制相似问题