首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Hpricot - UTF-8问题

Hpricot - UTF-8问题
EN

Stack Overflow用户
提问于 2012-06-13 21:51:16
回答 1查看 661关注 0票数 1

运行下面的代码时,我得到了以下错误:

代码语言:javascript
复制
invalid byte sequence in UTF-8 (ArgumentError)

代码:

代码语言:javascript
复制
require 'hpricot'
require 'open-uri'

doc = open('http://www.amazon.co.jp/') {|f| Hpricot(f.read) }
puts doc.to_html

Hpricot无法解析日语内容。对解决这个问题有什么建议吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-06-13 22:23:36

该网站似乎没有使用UTF-8:<meta http-equiv="content-type" content="text/html; charset=Shift_JIS" />

试着这样做:

代码语言:javascript
复制
open('http://www.amazon.co.jp/') {|f| Hpricot(f.read.encode("UTF-8")) }
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/11016328

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档