我有一个非常大的文本文件。这个文本文件中的每一行都有一个完整的句子。现在,我必须删除所有超过x个字符的行/句子,只保留包含<=x字符的行。
这有可能吗?我能用Notepad++/EditPlus或正则表达式做到这一点吗?
谢谢你的帮助!
发布于 2013-01-31 06:02:13
使用bash:
$ awk '{if (length($0) <= x) print $0; }' myfyle.txt其中x是长度。它将打印比x更小的行。
更多关于awk的好东西,请看Awk Tutorial and Introduction。
发布于 2013-01-31 06:00:39
这是针对Notepad++的解决方案
在搜索模式下选择“正则表达式”。确保“.matches newline”复选框未选中。
查找内容:.{x}.+
替换为:(空)
如果您不想在替换后留下空行:
查找内容:.{x}.+(\r?\n|\n|$)
将x替换为您选择的数字。
发布于 2014-07-09 17:41:30
这是Editplus版本3.70的解决方案。
如果您想保留<= 200的行,下面的命令将删除所有包含201个字符或更多字符的行。
正则表达式查找内容:^.{201,}.*\n
注意201后面的逗号。
https://stackoverflow.com/questions/14614591
复制相似问题