首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在Perl6中逐行读取文件,如何具体操作?

在Perl6中逐行读取文件,如何具体操作?
EN

Stack Overflow用户
提问于 2019-04-12 22:04:10
回答 1查看 341关注 0票数 7

我在Perl6中有一个基本脚本,它运行得非常慢,比精确的perl5翻译慢了大约30倍。

代码语言:javascript
复制
CONTROL {
    when CX::Warn {
        note $_;
        exit 1;
    }
}
use fatal;
role KeyRequired {
    method AT-KEY (\key) {
        die "Key {key} not found" unless self.EXISTS-KEY(key);
        nextsame;
    }
}

for dir(test => /^nucleotide_\d**2_\d**2..3\.tsv$/) -> $tsv {
    say $tsv;
    my $qqman = $tsv.subst(/\.tsv$/, '.qqman.tsv');
    my $out = open $qqman, :w;
    put "\t$qqman";
    my UInt $line-no = 0;
    for $tsv.lines -> $line {
        if $line-no == 0 {
            $line-no = 1;
            $out.put(['SNP', 'CHR', 'BP', 'P', 'zscore'].join("\t"));
            next
        }
        if $line ~~ /.+X/ {
            next
        }
        $line-no++;
        my @line = $line.split(/\s+/);
        my $chr = @line[0];
        my $nuc = @line[1];
        my $p = @line[3];
        my $zscore = @line[2];
        my $snp = "'rs$line-no'";
        $out.put([$snp, $chr, $nuc, $p, $zscore].join("\t"));
        #$out.put();
    }
    last
}

这在Perl5 5的while中是惯用的。

这是一个非常简单的脚本,它只更改文件中的文本列。这个Perl6脚本在30分钟内运行。Perl5转换在1分钟内运行。

我试过阅读Using Perl6 to process a large text file, and it's Too Slow.(2014-09)Perl6 : What is the best way for dealing with very big files?,但是在这里我没有看到任何可以帮助我的东西。

我在运行Rakudo version 2018.03 built on MoarVM version 2018.03 implementing Perl 6.c.

我意识到Rakudo还没有成熟到Perl5 5的水平(我希望如此),但是我如何才能在更合理的时间框架内逐行读取文件呢?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-04-13 02:21:56

有很多事情我都会改变。

  • /.+X/可以简化为/.X/甚至$line.substr(1).contains('X')
  • $line.split(/\s+/)可以简化为$line.words
  • $tsv.subst(/\.tsv$/, '.qqman.tsv')可以简化为$tsv.substr(*-4) ~ '.qqman.tsv'
  • uint而不是UInt
  • given .head {}而不是for … {last}
代码语言:javascript
复制
given dir(test => /^nucleotide_\d**2_\d**2..3\.tsv$/).head -> $tsv {
    say $tsv;
    my $qqman = $tsv.substr(*-4) ~ '.qqman.tsv';
    my $out = open $qqman, :w;
    put "\t$qqman";

    my uint $line-no = 0;
    for $tsv.lines -> $line {
        FIRST {
            $line-no = 1;
            $out.put(('SNP', 'CHR', 'BP', 'P', 'zscore').join("\t"));
            next
        }
        next if $line.substr(1).contains('X');

        ++$line-no;

        my ($chr,$nuc,$zscore,$p) = $line.words;

        my $snp = "'rs$line-no'";
        $out.put(($snp, $chr, $nuc, $p, $zscore).join("\t"));
        #$out.put();
    }
}
票数 11
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55659984

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档