首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >.net中boilerpipe的HtmlHighlighter并不总是返回文本

.net中boilerpipe的HtmlHighlighter并不总是返回文本
EN

Stack Overflow用户
提问于 2012-10-15 18:28:56
回答 1查看 222关注 0票数 2

我在我的应用程序中使用Boilerpipe,当我尝试使用ArticleExtractor提取内容时,我只获取平面文本,所有的html格式都被删除了,所以我尝试使用HtmlHighlighter。但是对于某些urls,HtmlHighlighter的处理方法会失败。是否有使用html字符串传递给此方法的选项?有谁能解释一下吗?

EN

回答 1

Stack Overflow用户

发布于 2016-06-01 17:47:16

您可以使用IKVM将Boilerpipe转换为新的DLL,以便在您的.NET应用程序中使用。我正在使用这种方法,并且在发送抛出不同boilerpipe方法的html时工作得很好。

如果您试图访问的页面内容是由javascript加载的,则简单的http请求无法处理此类信息。首先,您需要在javascript更改后获取结果html,然后将其提供给boilerpipe.

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/12893705

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档