我试图从xlsx文件创建一个kml,但当xlsx包含utf-8时,它无法工作。
我看到了simplekml文档,它被标记为已解决,但我无法使其工作。
我已经尝试将编码设置为ascii,也使用了django的smart_str和smart_unicode,但直到现在都不起作用。
我正在使用openpyxl读取文件
def create_kml(input_file,sheet_name,output_file,lat_column = 0,lng_column = 1):
kml = simplekml.Kml()
wb_read = load_workbook(input_file)
sh = wb_read.get_sheet_by_name(sheet_name)
properties = []
for c in sh.rows[0]:
properties.append(c.value.encode('utf-8'))
for p,row in enumerate(sh.rows[1:]):
for k,c in enumerate(row):
if k==0:
coord_tuple = (row[lng_column].value,row[lat_column].value)
pnt = kml.newpoint(name = 'Point %s' % p, coords =[coord_tuple])
#TODO: It's not working with unicode and utf-8
if k != lat_column and k != lng_column:
if type(row[k].value) == unicode or type(row[k].value) == str:
pnt.extendeddata.newdata(properties[k],row[k].value.encode('utf-8'))
kml.save(output_file)回溯:
Traceback (most recent call last):
File "<console>", line 1, in <module>
File "C:/Users/Fernando Alves/Dropbox/Projetos/utils.py", line 296, in create_kml
kml.save(output_file)
File "C:\Python27\lib\site-packages\simplekml\kml.py", line 285, in save
out = self._genkml(format)
File "C:\Python27\lib\site-packages\simplekml\kml.py", line 198, in _genkml
kml_str = self._feature.__str__()
File "C:\Python27\lib\site-packages\simplekml\featgeom.py", line 418, in __str__
buf.append(feat.__str__())
File "C:\Python27\lib\site-packages\simplekml\featgeom.py", line 414, in __str__
buf.append(super(Feature, self).__str__())
File "C:\Python27\lib\site-packages\simplekml\base.py", line 54, in __str__
buf.append(u("<{0}>{1}</{0}>").format(var, val)) # Enclose the variable's __str__ with its name
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 33: ordinal not in range(128)发布于 2013-10-16 22:11:54
我自己正在处理这个问题,但它出现在一些制表符分隔的数据中,我正在使用simplekml在KML中构建placemarks。问题的主要原因是所谓的制表符分隔文本包含一些高位字符。它们在解析时被复制到placemark的description字段中。当我保存KML文件时,出现此错误。
两年前在simplekml问题论坛上有一个关于这个问题的讨论:http://code.google.com/p/simplekml/issues/detail?id=10
有趣的是,在那里描述为接受发布(响应#6)的解决方案不在可通过pip获得的simplekml的当前版本中。此外,当我在本地应用补丁时,它没有什么不同。在base.py中出现相同的unicode解码错误。
我可以通过添加代码来过滤以制表符分隔的文本,然后在simplekml赋值和方法中使用它,从而解决我的特定情况。总而言之,simplekml要求其字符串中包含与ascii兼容的文本字符。
发布于 2015-06-05 18:02:29
我找到了解决方案,尽管您必须更改simplekml库...
以下是您要更改的文件:
/usr/local/lib/python2.7/dist-packages/simplekml/base.py
/usr/local/lib/python2.7/dist-packages/simplekml/kml/usr/local/lib/python2.7/dist-packages/simplekml/base.py
在第一个文件中,你必须删除所有出现的函数,,u,
/usr/local/lib/python2.7/dist-packages/simplekml/kml
在第二个文件中,您必须将第209行的从
kml_str = xml.dom.minidom.parseString(xml_str.encode("utf-8"))更改为:kml_str = xml.dom.minidom.parseString(xml_str.encode("utf-8"))。您必须删除所有出现的函数u.如果问题仍然存在,请遵循调试器删除所有出现的函数u,它应该可以正常工作!
我尝试更改u函数,但它不起作用...如果你找到了解决这个问题的办法,请告诉我们!
https://stackoverflow.com/questions/17354815
复制相似问题