好吧,我放弃了。为了从一个包含繁体中文编码(charset=GB2312)信息的目标网站检索数据,我一直在绞尽脑汁。
我一直像往常一样使用simple_html_parser,但它似乎不能返回中文字符,事实上,我得到的只是一个菱形形状中嵌入的一些奇怪的问号。("�������ѯ�ؼ��֣�“是这样的)
声明php文件的编码并没有做任何事情,只是去掉了页面开头显示的一些不想要的字符。
我宣布它的意思是:
header('Content-Type', 'text/html; charset=GB2312');我找不到任何用中文写的数据,也试过file_get_contents,运气也一样。我可能遗漏了一些明显的东西,因为我在其他地方找不到任何相关的讨论。
提前谢谢。
发布于 2010-02-12 07:30:11
你有没有尝试过用mb_convert_encoding或iconv转换编码,例如
$str = mb_convert_encoding($content, 'UTF-8', 'GB2312');或
$str = iconv("UTF-8", "GB2312//IGNORE", $content);发布于 2010-02-12 07:28:43
获取源代码使用的任何字符集,然后将其转换为本地可用的内容,如UTF-8。然后将其发送到浏览器。
发布于 2014-08-02 18:14:03
设置header('Content-Type: text/html; charset=utf-8');
它对我很有效
https://stackoverflow.com/questions/2248532
复制相似问题