我正在尝试建立一个数据库,其中包含由unicode提供的unihan.zip文件的中文unicode数据。
但是,该文件仅提供所分配的十六进制码位中的字符。(例如"U+547D")。
我的想法是手动转换(使用excel?)其中的每一个代码点,比如"U+547D“到"命”,然后将其保存为CSV UTF-8,然后使用phpmyadmin导入到mysql,我知道这是可行的。
我想知道phpmyadmin或mysql是否能够接受这种十六进制的码点格式作为更直接的数据导入方式?
我已经搜索了相当多的答案,但没有找到任何答案。我也尝试过以多种方式导入它,比如使用char函数,但是表被更新为"0x547D“而不是"命”。
任何对此的见解和帮助都将不胜感激。
发布于 2014-09-29 22:56:53
在将数据保存到数据库之前,您可能希望使用PHP将"0x547D“转换为十进制,然后创建一个类似于"命”的utf-8格式的字符。如果是这样的话,请看一下portable-utf8.php库,其中包含一个utf8_chr()函数。
顺便说一下,谢谢你让我知道unihan.zip..。我在寻找一个免费的、好的汉字资源。
https://stackoverflow.com/questions/25641099
复制相似问题