首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用Boilerpipe从网页中提取新闻内容?

如何使用Boilerpipe从网页中提取新闻内容?
EN

Stack Overflow用户
提问于 2012-04-09 03:04:48
回答 2查看 1.9K关注 0票数 0

我需要从网页中提取主要的新闻内容。我在互联网上搜索并找到了一个名为Boilerpipe的http://boilerpipe-web.appspot.com/,但我找不到任何使用Boilerpipe.Can的java实现。有人告诉我如何在Java中使用BoilerPipe来提取新闻内容,或者给我一些java实现的链接,这些实现利用BoilerPipe来从新闻网页中提取内容?

EN

回答 2

Stack Overflow用户

发布于 2012-06-22 21:27:32

也许我的回答太迟了。但这很简单。

代码语言:javascript
复制
 URL url = new URL("http://www.nydailynews.com/sports/baseball"); 
 ArticleExtractor ae = new ArticleExtractor();
 String content = ae.getText(url);  // this contains the final text
票数 1
EN

Stack Overflow用户

发布于 2016-03-05 19:41:20

很简单,假设您需要提取以下URL

只要使用我的boilerpipe替代Web API HERE,我的服务是基于BoilerPipe的,我开发这个是因为在原始application..you中获得超额配额错误,可以选择以JSON格式返回结果,只需在您的应用程序中使用它。

诚挚的问候

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10065560

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档