我有一个很大的字典文件,每行有一个单词,我想把它剪短。
我想要做的是留下3-6字母的不正确名词,所以它必须根据这些词来检测单词:
如果单词小于3个字母,则
我用这个:
cat Downloads/en-US/en-US.dic | egrep '[a-z]{3,6}' > Downloads/3-6.txt但是输出是不正确的。它输出的单词超过3个字符好,但这是关于我的进展到目前为止。
那么,我该如何在mac终端上这样做呢?一定有办法做得对吧?
发布于 2011-07-26 19:40:47
下面的命令将只选择由3到6个小写a字母组成的单词:
egrep '^[a-z]{3,6}$' /usr/share/dict/words > filtered.txt将/usr/share/dict/words替换为输入文件,将filtered.txt替换为输出文件的名称。我刚刚证实这在我的Mac上有效。希望这能有所帮助!
发布于 2011-07-26 08:42:42
使用grep并编写regex规则来匹配您想要保留的行。您可以通过在终端中键入man grep来获取grep的信息。
https://stackoverflow.com/questions/6827336
复制相似问题