我正在为捷克语单词表演Bigram生成。我可以用Python生成Bi。问题在于捷克语中的非英语字符。
输入:
共和报“proti znovuzvoleníObamy”。
执行Bigram,输出是
[‘\xc3\xa1n’,‘策略吉’,‘战略家’,'proti','znovuzvolen\xc3\xad',‘znovuzvolen\xc3xad’,'Obamy']
捷克语的特殊字母被转换为\xc3xAD。需要对代码进行哪些更改才能在输出中以正确的方式获得特殊的字母
发布于 2015-12-09 17:41:21
数据是正确的,但是当您将列表转换为字符串时,输出是使用repr为列表项准备的,而不是str。比较:
>>> x = [['republikán']]
>>> print(x)
[['republik\xc3\xa1n']]
>>> print(x[0])
['republik\xc3\xa1n']
>>> print(x[0][0])
republikán
>>>https://stackoverflow.com/questions/34185299
复制相似问题