我喜欢下载一些使用charset="UTF-8“的网页。
此页面是一个示例:2003
我总是有这样的特殊角色:碧昂斯圣保罗,而不是碧昂斯。
我尝试了以下代码:
WebClient webClient = new WebClient();
webClient.Encoding = System.Text.Encoding.UTF8;
webClient.DownloadFile(url, fileName);或者这个:
WebClient client = new WebClient();
Byte[] pageData = client.DownloadData(url);
string pageHtml = Encoding.UTF8.GetString(pageData);
System.IO.File.WriteAllText(fileName, pageHtml);我做错什么了?
我只想要一个简单的方式下载网页,并将它们写入文件。在完成之后,我将从这些文件中提取数据,显然我想要“正常”字符,就像我在原始网页上看到的那样,而不是一些特殊字符。
发布于 2015-01-31 12:29:49
问题是WriteAllText方法没有在文件中用UTF-8编写编码的文本。您应该添加编码:
System.IO.File.WriteAllText(fileName, pageHtml, Encoding.UTF8);https://stackoverflow.com/questions/28249555
复制相似问题