首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在C中尝试并真实地复制简单的文件代码?

在C中尝试并真实地复制简单的文件代码?
EN

Stack Overflow用户
提问于 2009-06-17 12:46:49
回答 7查看 12.6K关注 0票数 9

这看起来是个简单的问题,但我在这里没有发现任何类似的问题。

由于C中没有文件复制函数,所以我们必须自己实现文件复制,但是我不喜欢重新发明轮子,即使是在类似的琐碎事情上,所以我想问一下云:

  1. 您建议使用fopen()/fread()/fwrite()进行文件复制的代码是什么?
    • 您建议使用open()/read()/write()进行文件复制的代码是什么?

这段代码应该是可移植的(windows/mac/linux/bsd/qnx/younameit),稳定的,经过时间测试的,快速的,内存高效的等等。进入特定系统的内部来压缩更多的性能是受欢迎的(比如获取文件系统集群大小)。

这似乎是一个微不足道的问题,但例如,CP命令的源代码不是10行C代码。

EN

回答 7

Stack Overflow用户

回答已采纳

发布于 2009-06-17 15:32:16

就实际I/O而言,我用不同的伪装编写了数百万次代码,以便将数据从一个流复制到另一个流中。它在成功时返回0,或者在错误设置为errno的情况下返回-1 (在这种情况下,可能复制了任意数量的字节)。

注意,对于复制常规文件,您可以跳过EAGAIN的内容,因为常规文件总是阻塞I/O,但是不可避免地,如果您编写了这段代码,就会有人在其他类型的文件描述符上使用它,所以请考虑它是免费的。

GNU cp有一个特定于文件的优化,我在这里没有费心地对它进行优化,对于0字节的长块,您只需要通过查找结束来扩展输出文件,而不是编写。

代码语言:javascript
复制
void block(int fd, int event) {
    pollfd topoll;
    topoll.fd = fd;
    topoll.events = event;
    poll(&topoll, 1, -1);
    // no need to check errors - if the stream is bust then the
    // next read/write will tell us
}

int copy_data_buffer(int fdin, int fdout, void *buf, size_t bufsize) {
    for(;;) {
       void *pos;
       // read data to buffer
       ssize_t bytestowrite = read(fdin, buf, bufsize);
       if (bytestowrite == 0) break; // end of input
       if (bytestowrite == -1) {
           if (errno == EINTR) continue; // signal handled
           if (errno == EAGAIN) {
               block(fdin, POLLIN);
               continue;
           }
           return -1; // error
       }

       // write data from buffer
       pos = buf;
       while (bytestowrite > 0) {
           ssize_t bytes_written = write(fdout, pos, bytestowrite);
           if (bytes_written == -1) {
               if (errno == EINTR) continue; // signal handled
               if (errno == EAGAIN) {
                   block(fdout, POLLOUT);
                   continue;
               }
               return -1; // error
           }
           bytestowrite -= bytes_written;
           pos += bytes_written;
       }
    }
    return 0; // success
}

// Default value. I think it will get close to maximum speed on most
// systems, short of using mmap etc. But porters / integrators
// might want to set it smaller, if the system is very memory
// constrained and they don't want this routine to starve
// concurrent ops of memory. And they might want to set it larger
// if I'm completely wrong and larger buffers improve performance.
// It's worth trying several MB at least once, although with huge
// allocations you have to watch for the linux 
// "crash on access instead of returning 0" behaviour for failed malloc.
#ifndef FILECOPY_BUFFER_SIZE
    #define FILECOPY_BUFFER_SIZE (64*1024)
#endif

int copy_data(int fdin, int fdout) {
    // optional exercise for reader: take the file size as a parameter,
    // and don't use a buffer any bigger than that. This prevents 
    // memory-hogging if FILECOPY_BUFFER_SIZE is very large and the file
    // is small.
    for (size_t bufsize = FILECOPY_BUFFER_SIZE; bufsize >= 256; bufsize /= 2) {
        void *buffer = malloc(bufsize);
        if (buffer != NULL) {
            int result = copy_data_buffer(fdin, fdout, buffer, bufsize);
            free(buffer);
            return result;
        }
    }
    // could use a stack buffer here instead of failing, if desired.
    // 128 bytes ought to fit on any stack worth having, but again
    // this could be made configurable.
    return -1; // errno is ENOMEM
}

要打开输入文件:

代码语言:javascript
复制
int fdin = open(infile, O_RDONLY|O_BINARY, 0);
if (fdin == -1) return -1;

打开输出文件很棘手。作为基础,你想:

代码语言:javascript
复制
int fdout = open(outfile, O_WRONLY|O_BINARY|O_CREAT|O_TRUNC, 0x1ff);
if (fdout == -1) {
    close(fdin);
    return -1;
}

但也有令人困惑的因素:

  • 当文件相同时,您需要特殊情况,而我不记得如何移植。
  • 如果输出文件名是目录,则可能需要将该文件复制到该目录中。
  • 如果输出文件已经存在(用O_EXCL打开以确定这一点并检查错误时的EEXIST ),您可能想要做一些与cp -i不同的事情。
  • 您可能希望输出文件的权限反映输入文件的权限。
  • 您可能希望复制其他特定于平台的元数据。
  • 如果出现错误,您可能希望或不希望解除输出文件的链接。

显然,所有这些问题的答案都可以是“和cp一样”。在这种情况下,最初问题的答案是“忽略我或其他人所说的一切,并使用cp的来源”。

顺便说一句,获取文件系统的集群大小几乎毫无用处。在您传递磁盘块大小之后很长一段时间内,您几乎总是会看到缓冲区大小的速度在增加。

票数 3
EN

Stack Overflow用户

发布于 2009-06-18 00:38:47

这是我需要从一个文件复制到另一个文件时使用的函数--使用测试工具:

代码语言:javascript
复制
/*
@(#)File:           $RCSfile: fcopy.c,v $
@(#)Version:        $Revision: 1.11 $
@(#)Last changed:   $Date: 2008/02/11 07:28:06 $
@(#)Purpose:        Copy the rest of file1 to file2
@(#)Author:         J Leffler
@(#)Modified:       1991,1997,2000,2003,2005,2008
*/

/*TABSTOP=4*/

#include "jlss.h"
#include "stderr.h"

#ifndef lint
/* Prevent over-aggressive optimizers from eliminating ID string */
const char jlss_id_fcopy_c[] = "@(#)$Id: fcopy.c,v 1.11 2008/02/11 07:28:06 jleffler Exp $";
#endif /* lint */

void fcopy(FILE *f1, FILE *f2)
{
    char            buffer[BUFSIZ];
    size_t          n;

    while ((n = fread(buffer, sizeof(char), sizeof(buffer), f1)) > 0)
    {
        if (fwrite(buffer, sizeof(char), n, f2) != n)
            err_syserr("write failed\n");
    }
}

#ifdef TEST

int main(int argc, char **argv)
{
    FILE *fp1;
    FILE *fp2;

    err_setarg0(argv[0]);
    if (argc != 3)
        err_usage("from to");
    if ((fp1 = fopen(argv[1], "rb")) == 0)
        err_syserr("cannot open file %s for reading\n", argv[1]);
    if ((fp2 = fopen(argv[2], "wb")) == 0)
        err_syserr("cannot open file %s for writing\n", argv[2]);
    fcopy(fp1, fp2);
    return(0);
}

#endif /* TEST */

显然,这个版本使用的是来自标准I/O的文件指针,而不是文件描述符,但它是相当高效的,并且尽可能地具有可移植性。

嗯,除了错误函数-这是我特有的。只要你干净地处理错误,你就会没事。"jlss.h"报头声明fcopy()"stderr.h"报头在许多类似的错误报告函数中声明err_syserr()。下面是函数的一个简单版本--真正的函数添加了程序名,并做了一些其他的事情。

代码语言:javascript
复制
#include "stderr.h"
#include <stdarg.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>

void err_syserr(const char *fmt, ...)
{
    int errnum = errno;
    va_list args;
    va_start(args, fmt);
    vfprintf(stderr, fmt, args);
    va_end(args);
    if (errnum != 0)
        fprintf(stderr, "(%d: %s)\n", errnum, strerror(errnum));
    exit(1);
}

以上代码可能被视为拥有现代的BSD许可证或GPL v3供您选择。

票数 5
EN

Stack Overflow用户

发布于 2009-10-26 14:12:43

每个读取的大小需要为512 (扇区大小) 4096的倍数,这是一个很好的结果。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1006797

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档