我有一个从数据库读取数据并将其输出到文本文件的C#程序。
OleDbCommand cmd = new OleDbCommand("SELECT * FROM " + tableName, conn);
OleDbDataReader rdr = cmd.ExecuteReader();
if (rdr.HasRows)
{
while (rdr.Read())
{
for (int i = 0; i < rdr.FieldCount; i++)
{
string toStr = rdr[i].ToString();
// ...etc.有一句话总是给我带来麻烦。下面是它在数据库中的样子:
Signed 8-bit 2’s-compliment下面是我的输出文件中的内容:
Signed 8-bit 2’s-compliment我想我可以通过考虑编码来解决这个问题。因此,我更改了代码,将文本转换为UTF-8:
string toStr = Encoding.UTF8.GetString(Encoding.Default.GetBytes(rdr[i].ToString()));这会导致:
Signed 8-bit 2�s-compliment但是,如果我这样做...
string toStr = Encoding.UTF8.GetString(Encoding.Default.GetBytes("Signed 8-bit 2’s-compliment"));...it可以完美地工作。
Signed 8-bit 2’s-complimentrdr[i].toString()可能是问题所在吗?我的猜测是,当它将对象转换为字符串时,它会搞乱’字符的编码,这使我无法将其正确地转换为撇号。但我不认为我可以避免在那里使用toString()。那我该怎么办呢?
发布于 2016-05-14 04:20:13
问题的根源在于数据库的一端。假设是SQL Server,看一下这个关于Collation and Unicode Support的链接。基本上,您的数据可能不会以您认为的格式返回。
一般而言,SQL支持UTF-16,而不是UTF-8 -所以只要数据被正确返回,ToString()就应该正确地解码它,因为.NET字符串的格式是UTF-16。
此外,如果您不特别关心该特定字符,您可以只更新您的数据库记录,并为该行文本设置一个“普通”撇号。
https://stackoverflow.com/questions/37218521
复制相似问题