首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何并行使用Linux的"cut“

如何并行使用Linux的"cut“
EN

Stack Overflow用户
提问于 2015-04-29 00:31:52
回答 1查看 2.6K关注 0票数 2

我有一个很大的制表符分隔文件(10TB)。

我想将文件分成特定的列,并且希望使用我的24个内核中的每一个并行执行。

代码语言:javascript
复制
cut -f1,2,3 file > out

有没有关于如何使用多核或并行来完成这项工作的想法?

我有一些想法,比如

代码语言:javascript
复制
cat file | parallel --round-robin --pipe  "cut -f1 1,2,3"  > out

cat file | parallel --round-robin --pipe --block 1000000k "cut -f1 1,2,3"  > out
EN

回答 1

Stack Overflow用户

发布于 2015-05-03 03:49:13

如果磁盘不是限制因素(但CPU是):

代码语言:javascript
复制
parallel -k --pipepart -a big.tsv --block 1g cut -f1 1,2,3 > out
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29924983

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档