我有一个包含故事的文件,我需要练习使用grep或sed。我已经尝试过egrep -i '^w.' file.txt,它得到了大部分的单词,但是我需要以w开头的每个单词(“书面文件”无效,“工作”有效)。
发布于 2019-10-29 06:51:01
您可能需要一个regexp来隔离word start (\b)并识别单词字符,例如\S,有关更多信息,请参见文档。这样您就可以使用命令
$ grep -oE '\bw\S*' inputfile对于-o,结果将只是匹配的部分,每一个匹配都在一个新的行上(甚至从一个输入行),而-E能够使用"extended“(与使用egrep相同)。
更严格的"word“匹配可能使用[[:alpha:]]而不是\S:
$ grep -oE '\bw[[:alpha:]]*' inputfile这将导致英语字符集中的“单词”(字符序列),从"w“开始。
https://unix.stackexchange.com/questions/549246
复制相似问题