首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python chardet无法正确检测utf-8。

python chardet无法正确检测utf-8。
EN

Stack Overflow用户
提问于 2017-09-09 14:36:09
回答 1查看 1.5K关注 0票数 1
代码语言:javascript
复制
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import chardet
s = '123'.encode('utf-8')
print(s)
print(chardet.detect(s))

ss ='编程'.encode('utf-8')
print(chardet.detect(ss))

和结果

代码语言:javascript
复制
b'123'
{'encoding': 'ascii', 'confidence': 1.0, 'language': ''}
{'encoding': 'utf-8', 'confidence': 0.7525, 'language': ''}

为什么不能检测到s作为UTF-8?

为什么是ASCII?

这行没用吗?# -*- coding: utf-8 -*- Python新手,谢谢!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-09 14:42:26

让我们来谈谈这些台词--所有的肉都在那里

代码语言:javascript
复制
s = '123'.encode('utf-8')
print(s)

Python 3默认使用Unicode是正确的。当您说'123'.encode()时,您要将Unicode字符串转换为一个字节序列,然后使用丑陋的b前缀进行打印,以提醒您它不是默认类型的字符串。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46131755

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档