我有一个包含40000多行唯一浮点数字的XY文件。我想对这个文件使用bootstrap重采样。引导重采样的工作原理如下:它使用输入文件中的替换对N个随机行(N是输入文件的数量)进行重采样。这意味着新数据集(输出)具有与第一个文件相同的行数,并且新数据集可以多次包含某些行,并且可能根本不包含某些原始行。我试着用下面的命令来洗牌。
shuf -n N input > output和
sort -R input | head -n N > output,但看起来他们并没有实现替换。
如果有人能介绍一种使用AWK和Shell来做这件事的方法,我们将不胜感激。
发布于 2020-06-25 15:13:36
我相信你想要的是:
假设您有一个输入文件input,其中包含以下内容:
$ seq 10 > input然后,您可以获得一个新的随机文件,其中包含相同的行和可能的重复,如下所示:
$ shuf -rn $(wc -l input) input
7
2
9
3
1
7
4
8
7
10在这里,我们使用-r标志来允许重复。
https://stackoverflow.com/questions/62569435
复制相似问题