首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我试图使用ibm云错误中使用熊猫的数据集=‘utf-8’编解码器无法解码135-136位置的字节:无效的连续字节。

我试图使用ibm云错误中使用熊猫的数据集=‘utf-8’编解码器无法解码135-136位置的字节:无效的连续字节。
EN

Stack Overflow用户
提问于 2021-08-09 05:02:23
回答 1查看 134关注 0票数 0

这是ibm云在我上传数据集时自动生成的代码,我尝试了编码=‘拉丁语-1’,但它还是给了我错误。

代码语言:javascript
复制
import os, types
import pandas as pd
from botocore.client import Config
import ibm_boto3

def __iter__(self): return 0

if os.environ.get('RUNTIME_ENV_LOCATION_TYPE') == 'external':
    endpoint_3660ea30b8c954806ac4 = 'https://s3.us.cloud-object-storage.appdomain.cloud'
else:
    endpoint_3660ea30b8c954806ac4 = 'https://s3.private.us.cloud-object-storage.appdomain.cloud'

client_3660ea30b8c954806ac4 = ibm_boto3.client(service_name='s3',
    ibm_api_key_id='xjHcqdBlY9iaaD7qu17e6-njKJPFSdGWk4d',
    ibm_auth_endpoint="https://iam.cloud.ibm.com/oidc/token",
    config=Config(signature_version='oauth'),
    endpoint_url=endpoint_3660ea30b8c954806ac4)

body = client_3660ea30b8c954806ac4.get_object(Bucket='spamdetectionmodel-donotdelete-pr-mt98rs41prv05c',Key='spam.csv')['Body']
# add missing __iter__ method, so pandas accepts body as file-like object
if not hasattr(body, "__iter__"): body.__iter__ = types.MethodType( __iter__, body )
df_data_1 = pd.read_csv(body)
df_data_1.head()

错误:

'utf-8‘编解码器无法解码位置135-136的字节:无效的连续字节

EN

回答 1

Stack Overflow用户

发布于 2021-08-09 05:33:41

您是否尝试过更改“熊猫encoding”设置,请尝试如下:

代码语言:javascript
复制
df_data_1 = pd.read_csv(body, encoding='utf-8')

或者另一种选择:

代码语言:javascript
复制
df_data_1 = pd.read_csv(body, encoding='ISO-8859-1')

阅读encoding设置,下面帮助我解决这样的错误:

UnicodeDecodeError when reading CSV file in Pandas with Python

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68707045

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档