首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ISO-8859-1字符截断插入到utf-8 mysql列的文本

ISO-8859-1字符截断插入到utf-8 mysql列的文本
EN

Stack Overflow用户
提问于 2013-08-09 07:47:51
回答 3查看 2.1K关注 0票数 0

所以我有一个奇怪的截断问题!在这个问题上找不到具体的答案。

因此,基本上存在一个明显的ISO字符的问题,在插入到指定了UTF-8的列中时,会截断其余的文本。

假设我的字符串是:“你需要加半杯水。”MySQL会将其截断为“你需要添加”

如果我:

代码语言:javascript
复制
print iconv("ISO-8859-1", "UTF-8//IGNORE", $text);

然后输出:

代码语言:javascript
复制
½

O_o

好吧,这是行不通的,因为我需要1/2本身。如果我转到phpMyAdmin,复制并粘贴句子并提交它,它就像一个咒语,因为整个字符串都在那里,只有一半的符号和剩余的文本!有些地方不对劲,我对它到底是什么感到困惑。我知道这可能会影响其他角色,所以需要解决潜在的问题。

我使用的语言是php,文件本身编码为UTF-8,我引入的数据的content-type设置为ISO-8859-1。列是utf8_general_ci,并且在php中所有的mysql字符集都设置为UTF-8:"SET character_set_result = 'utf8',等等...“

EN

回答 3

Stack Overflow用户

发布于 2014-11-12 07:50:47

代码中的某些东西没有将字符串处理为UTF8。它可能是你的PHP/HTML,它可能在你与数据库的连接中,也可能是数据库本身-所有东西都必须一致地设置为UTF8,如果有任何东西不一致,字符串将被截断,就像你在传递utf8/非utf8边界时看到的那样。

我会假设你的数据库是UTF8兼容的--这是最容易检查的。请注意,可以在服务器级别、数据库级别、表级别和表中的列级别设置排序规则。在列上设置UTF8排序规则应该覆盖用于存储的任何其他内容,但是如果其他排序规则不也是UTF8的,那么它们在与DB对话时仍然会起作用。如果您不确定,请在打开后将连接显式设置为UTF8:

代码语言:javascript
复制
$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");

现在你的数据库和连接是UTF8的,确保你的网页也是。同样,可以在多个位置(.htaccess、php.ini)进行设置。如果您不确定/没有访问权限,只需覆盖PHP在页面顶部选取的默认内容:

代码语言:javascript
复制
<?php ini_set('default_charset', 'UTF-8'); ?>

请注意,在从页面输出任何文本之前,您需要在开始时使用上面的代码。一旦文本得到输出,尝试指定编码可能就太晚了-您可能已经被锁定在服务器上的默认编码中。然后我还在我的头文件中重复这一点(可能是过度杀伤力):

代码语言:javascript
复制
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
</head>

我在获取数据的表单上覆盖它:

代码语言:javascript
复制
<FORM NAME="utf8-test" METHOD="POST" ACTION="utf8-test.php" enctype="multipart/form-data" accept-charset="UTF-8">"

老实说,如果你在顶部设置了编码,我的理解是其他重写是不需要的-但我还是保留了它们,因为它也不会破坏任何东西,我宁愿只显式地声明编码,而不是让服务器做出假设。

最后,您提到在phpMyAdmin中插入了字符串,它看起来与预期的一样-尽管phpMyAdmin页面是UTF8的,但您确定吗?我不认为他们是。当我从我的PHP代码中存储UTF8数据时,它看起来就像phpMyAdmin中的原始8位字符。如果我将相同的字符串直接存储在phpMyAdmin中,它看起来是“正确的”。所以我猜phpMyAdmin使用的是我的本地服务器的默认字符集,而不一定是UTF8。

例如,存储在我的网页中的以下字符串:

代码语言:javascript
复制
I can¹t wait

在我的phpMyAdmin中读起来是这样的:

代码语言:javascript
复制
I can’t wait

因此,在以这种方式进行测试时要小心,因为您并不真正了解phpMyAdmin用于显示或DB连接的编码。

如果你仍然有问题,试试我下面的代码。首先,我创建了一个表来存储UTF8中的文本:

代码语言:javascript
复制
CREATE TABLE IF NOT EXISTS `utf8_test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `my_text` varchar(8000) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;

下面是一些PHP来测试它。它基本上接受表单上的输入,将输入回显给您,并从DB中存储/检索文本。

代码语言:javascript
复制
<?php
  // Override whatever is set in php.ini
  ini_set('default_charset', 'UTF-8');

  // The following should not be required with the above override
  //header('Content-Type:text/html; charset=UTF-8');

  // Open the database
  $dbh = new PDO('mysql:dbname=utf8db;host=127.0.0.1;charset=utf8', 'root', 'password');

  // Set the connection to UTF8
  $dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
  // Tell MySql to do the parameter replacement, not PDO
  $dbh->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);
  // Throw exceptions (and break the code) if a query is bad
  $dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);

  $id = 0;
  if (isset($_POST["StoreText"]))
  {
    $stmt = $dbh->prepare('INSERT INTO utf8_test (my_text) VALUES (:my_text)');
    $stmt->execute(array(':my_text' => $_POST['my_text']));
    $id = $dbh->lastInsertId();
  }
?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional/EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">

<title>UTF-8 Test</title>
</head>

<body>

<?php
  // If something was posted, output it
  if (isset($_POST['my_text']))
  {
    echo "POSTED<br>\n";
    echo $_POST['my_text'] . "<br>\n";
  }

  // If something was written to the database, read it back, and output it
  if ($id > 0)
  {
    $stmt = $dbh->prepare('SELECT my_text FROM utf8_test WHERE id = :id');
    $stmt->execute(array(':id' => $id));
    if ($result = $stmt->fetch())
    {
      echo "STORED<br>\n";
      echo $result['my_text'] . "<br>\n";
    }
  }

  // Create a form to take some user input
  echo "<FORM NAME=\"utf8-test\" METHOD=\"POST\" ACTION=\"utf8-test.php\" enctype=\"multipart/form-data\" accept-charset=\"UTF-8\">";

  echo "<br>";

  echo "<textarea name=\"my_text\" rows=\"20\" cols=\"90\">";

  // If something was posted, include it on the form
  if (isset($_POST['my_text']))
  {
    echo $_POST['my_text'];
  }

  echo "</textarea>";

  echo "<br>";
  echo "<INPUT TYPE = \"Submit\" Name = \"StoreText\" VALUE=\"Store It\" />";

  echo "</FORM>";
?>
<br>

</body>

</html>
票数 4
EN

Stack Overflow用户

发布于 2013-08-09 12:51:43

如果不能更改数据的处理方式,请签入mb_convert_encoding。否则,帮你自己一个忙,在代码失控之前把你的代码放在同一页上。UTF-8使用ISO-8859-1 (拉丁)编码中不能识别的多字节字符。wikipediaThis pagethis page以及this debug table都是很好的资源。

最后,在使用htmlentities、htmlspecialchars和html_entity_decode的各种组合时,我遇到了这个问题。

票数 0
EN

Stack Overflow用户

发布于 2014-01-30 23:40:07

您是否在MySQLi数据库连接上调用了set_charset()?这是正确使用real_escape_string()所必需的。

代码语言:javascript
复制
$db = new mysqli(...);
$db->set_charset('utf8');

在连接中设置会话变量是不够的--它们会影响服务器端发生的事情。set_charset将影响客户端发生的事情。

您可以查看PHP参考mysqli::real_escape_string

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/18138097

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档