我很难找到一个使用JRuby的超文本标记语言解析器。
我喜欢使用Nokogiri进行HTML解析,但Nokogiri需要使用bxml2.dll,我的机器上没有bxml2.dll,也不确定我能确保它在所有用户的机器上都可用。
我尝试使用另一个最喜欢的,Scrubyt,但这依赖于机械化,这也需要Nokogiri。
你推荐哪种Ruby HTML解析器与JRuby一起使用?
发布于 2010-08-25 19:48:50
THe纯java版本的Nokogiri不依赖于libxml2或任何二进制文件。参见http://wiki.github.com/tenderlove/nokogiri/pure-java-nokogiri-for-jruby。
Hpricot是一个流行的HTML解析库,它也有一个纯java端口。功能类似,实际上Hpricot是使用CSS选择器进行HTML解析的解析器。
发布于 2010-08-23 06:37:00
为什么不使用纯java版本的nokogiri呢?
http://github.com/tenderlove/nokogiri/tree/java
https://stackoverflow.com/questions/3543703
复制相似问题