文章/答案/技术大牛

发布

社区首页 >问答首页 >阅读阿里巴巴开放源码软件中的一个对象，并使用熊猫蟒蛇修改它

问阅读阿里巴巴开放源码软件中的一个对象，并使用熊猫蟒蛇修改它
EN

Stack Overflow用户

提问于 2021-04-28 04:30:32

回答 1查看 385关注 0票数 0

所以，我的数据是在阿里巴巴云的开放源码桶中的CSV文件格式。我目前正在执行Python脚本，其中：

我将文件下载到本地机器。
在本地机器中使用

脚本进行更改。

将其存储在AWSCloud.

中。

我必须修改这个方法，并在阿里巴巴云中安排一个cron作业来自动化这个脚本的运行。Python脚本将上传到阿里巴巴云的任务管理中。

因此，新的步骤是：

Pandas.

Modify

将OSS桶中的一个文件读入 it --将其与其他数据合并，进行一些列更改。-将在pandas.

Store中完成修改后的文件到AWS .

中

我被困在第一步本身。错误日志：

“没有模块找到”为OSS2和熊猫。

正确的做法是什么？

这是我的脚本的粗略草稿(关于如何在本地机器上执行脚本)：

import os,re
import oss2 -- **throws an error. No module found.**
import datetime as dt
import pandas as pd -- **throws an error. No module found.**
import tarfile
import mysql.connector
from datetime import datetime
from itertools import islice
dates = (dt.datetime.now()+dt.timedelta(days=-1)).strftime("%Y%m%d")
def download_file(access_key_id,access_key_secret,endpoint,bucket):

    #Authentication
    auth = oss2.Auth(access_key_id, access_key_secret)

    # Bucket name
    bucket = oss2.Bucket(auth, endpoint, bucket)

    # Download the file
    try:
        # List all objects in the fun folder and its subfolders.
        for obj in oss2.ObjectIterator(bucket, prefix=dates+'order'):
            order_file = obj.key
            objectName = order_file.split('/')[1]
            df = pd.read_csv(bucket.get_object(order_file)) # to read into pandas
            # FUNCTION to modify and upload
        print("File downloaded")
    except:
        print("Pls check!!! File not read")
    return objectName

python

alibaba-cloud

alibaba-cloud-oss

回答 1

Stack Overflow用户

发布于 2021-10-21 16:18:58

import os,re
import oss2 
import datetime as dt
import pandas as pd 
import tarfile
import mysql.connector
from datetime import datetime
from itertools import islice

import io ## include this new library 

dates = (dt.datetime.now()+dt.timedelta(days=-1)).strftime("%Y%m%d")
def download_file(access_key_id,access_key_secret,endpoint,bucket):

    #Authentication
    auth = oss2.Auth(access_key_id, access_key_secret)

    # Bucket name
    bucket = oss2.Bucket(auth, endpoint, bucket)

    # Download the file
    try:
        # List all objects in the fun folder and its subfolders.
        for obj in oss2.ObjectIterator(bucket, prefix=dates+'order'):
            order_file = obj.key
            objectName = order_file.split('/')[1]


            bucket_object = bucket.get_object(order_file).read() ## read the file from OSS 
            img_buf = io.BytesIO(bucket_object)) 

            df = pd.read_csv(img_buf) # to read into pandas
            # FUNCTION to modify and upload
        print("File downloaded")
    except:
        print("Pls check!!! File not read")
    return objectName

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/67293799

复制

相似问题

问阅读阿里巴巴开放源码软件中的一个对象，并使用熊猫蟒蛇修改它
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问阅读阿里巴巴开放源码软件中的一个对象，并使用熊猫蟒蛇修改它EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问阅读阿里巴巴开放源码软件中的一个对象，并使用熊猫蟒蛇修改它
EN