我有一个ispell巨大的.mwl文件,我希望删除所有ispell后缀,以便使用unix、bash或perl命令生成一个简单的文本单词词典。
有ispell命令选项可以这样做吗?
(在unix中,.mwl.gz文件位于/usr/share/ispell/目录中)
文件的简短摘录,不是详尽无遗的:
a/MRSY
A'asia
a'body
a'thing
aaa
AAAS
Aaberg/M
Aachen/M
Aaedon/M
AAeE
AAeE's
aaerially
aaerialness
Aaerope/M
AAgr/M
aah/DGS
aal/MS
Aalborg
Aalesund
aalii/MS
Aaliyah/M
Aalst/M
Aalto
aam
Aandahl/M
Aani/M
Aaqbiye/M
Aar/MN
Aara/M
Aarau
aardvark/MS
aardwolf/M
aardwolves
Aaren/M
Aargau
aargh
Aarhus
Aarika/M
aarogramme发布于 2021-12-07 00:32:02
我不知道你所说的后缀是什么意思,但我假设这是你的示例文本中/或‘后面的部分。您可以使用一个来自Bash的简单管道来完成这个任务。
cat something.mwl | perl -pe 's{[/\x27].*$}{}; ' > stripped_something.txt-p开关意味着在管道中运行perl。无论您输入的是什么,都会一次放进$_一行,然后再打印出来。注意,我在regex中放置了撇号的\x27。在命令行中转义是一个很大的痛苦。如果有任何其他字符启动后缀,则可以将它们放入字符类中。
在以这种方式打印出来之前,你可以在生产线上做任何其他的工作。
有关perlrun开关的更多信息,请参阅-p文档。
https://stackoverflow.com/questions/70252057
复制相似问题