我正在使用hpricot来读取HTML。我发现了一个分段错误,我搜索了一下,有人说升级到最新版本的Ruby。我使用的是rails 2.3.2和ruby 1.8.7。如何解决此错误?
发布于 2009-09-03 19:11:53
我试图解析包含许多unicode字符的html页面,但Hpricot总是崩溃。最后,我使用来自sanitize的猴子补丁,并将其放入我的rails应用程序的environment.rb中。自从我添加了这个补丁后,还没有发生过一次崩溃:
http://github.com/rgrove/sanitize/blob/1e1dc9681de99e32dc166f591343dfa60fc1f648/lib/sanitize/monkeypatch/hpricot.rb
发布于 2009-07-25 11:42:32
如果您可以自由选择您的HTML解析库,那么可以切换它。为什么,Hpricot的创建者最近发布了一篇文章,说现在你应该用Nokogiri而不是HPricot。
你也可以看看HTTParty。
发布于 2011-05-13 16:32:33
在ruby 1.8.5上,尝试使用hpricot -v 0.6.161
这对我很管用。
https://stackoverflow.com/questions/930742
复制相似问题