我正在尝试设置一个小的Android应用程序,它使用Goose库从网页中提取内容。因为这个库是用Scala编写的,所以我使用的是我找到的here的.jar。问题是,当我试图从页面中提取内容时,它什么也不返回。我使用所需的URL成功地创建了一个Article对象,但对象的值(标题、域、topImage等)都是null。我尝试使用不同的urls,以查看问题是否与单个网站有关,但似乎并非如此。
我用来设置Goose实例的代码如下:
gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);然后创建Article实例,如下所示:
Article article = goose.extractContent(url);有什么建议吗?
发布于 2016-09-05 17:22:31
实际上,由于不兼容,你不能在安卓上使用Goose库,但你可以使用我的安卓版本:https://github.com/milosmns/goose
它几乎和Goose做同样的事情,只是在Android上运行良好。
https://stackoverflow.com/questions/24978300
复制相似问题