我正在从一个网站从网站接收ISO-8859-2的数据,然后将其转换为UTF-8 (也用作MySQL编码),并做一些修改和存储数据...
当我打印数据时,一切似乎都很好...当我将数据存储到我的表中并从那里打印它时,一切都很棒……但是,当我比较新接收的数据并与存储在mysql中的数据进行比较时,尽管数据是相同的,但我总是得不到匹配。所以我检查了数据库..当我在DB中打开数据时,我看到在末尾或中间有一个标志……例如:e.、‡等。
有什么想法吗?
更新:我使用InnoDB存储引擎来启用事务。确切的DB编码是UTF8_GENERAL_CI
发布于 2012-11-09 18:11:13
我得到了ISO-8859-2输入数据...
首先,我将奇怪的符号替换为:
$data = str_replace(chr(194), "", $data);
chr() uses ASCII code to search sign... 下一步是将数据转换为UTF-8编码
$data = iconv('ISO-8859-2', 'UTF-8//TRANSLIT', $data);我收到经过字符转换的字符串,但同样的符号又以某种方式出现了,我也是这样做的
$data = str_replace(chr(194), "", $data);再一次..。在那之后,我做了:
$data = @iconv('UTF-8', 'UTF-8//IGNORE', $data);这给了我干净的UTF-8,以防还包含一些奇怪的字符...@在开始时是为了避免在失败时抛出错误...
我相信这真的是一个特殊的案例--我处理外部数据已经有很长一段时间了,没有像这样的案例,但希望有一天有人会需要它……
感谢你们的帮助和合作……如果没有社区的支持,我将无法解决这个问题!谢谢!
https://stackoverflow.com/questions/13247683
复制相似问题