首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >拆分Excel文件而不打开

拆分Excel文件而不打开
EN

Stack Overflow用户
提问于 2019-11-28 00:07:43
回答 1查看 813关注 0票数 0

我在黑客马拉松或Kaggle比赛中获得了excel文件,这些比赛的大小以Gb为单位。我的8 8gb i7英特尔系统如果我直接打开它,或者用python或R加载它,就会崩溃。我想知道有没有什么方法可以在不打开的情况下拆分文件。

EN

回答 1

Stack Overflow用户

发布于 2019-11-28 14:04:18

代码语言:javascript
复制
 Splits a CSV file into multiple pieces.

A quick bastardization of the Python CSV library.

Arguments:

    `row_limit`: The number of rows you want in each output file. 10,000 by default.
    `output_name_template`: A %s-style template for the numbered output files.
    `output_path`: Where to stick the output files.
    `keep_headers`: Whether or not to print the headers in each output file.

Example usage:

    >> from toolbox import csv_splitter;
    >> csv_splitter.split(open('/home/ben/input.csv', 'r'));
代码语言:javascript
复制
reader = csv.reader(filehandler, delimiter=delimiter)
current_piece = 1
current_out_path = os.path.join(
     output_path,
     output_name_template  % current_piece
)
current_out_writer = csv.writer(open(current_out_path, 'w'), delimiter=delimiter)
current_limit = row_limit
if keep_headers:
    headers = next(reader)
    current_out_writer.writerow(headers)
for i, row in enumerate(reader):
    if i + 1 > current_limit:
        current_piece += 1
        current_limit = row_limit * current_piece
        current_out_path = os.path.join(
           output_path,
           output_name_template  % current_piece
        )
        current_out_writer = csv.writer(open(current_out_path, 'w'), delimiter=delimiter)
        if keep_headers:
            current_out_writer.writerow(headers)
    current_out_writer.writerow(row)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59074232

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档