文章/答案/技术大牛

发布

社区首页 >问答首页 >在文件层次结构中的选定编码系统中搜索文本

问在文件层次结构中的选定编码系统中搜索文本
EN

Stack Overflow用户

提问于 2012-02-15 08:44:47

回答 1查看 243关注 0票数 1

我想在文件层次结构中搜索指定编码系统(le 1251/utf-8/utf-16-le/iso-8859-4等)中的文本。

例如，我有cp1251编码中的源代码，我使用系统编码UTF-8运行Debian。grep或午夜指挥官在UTF-8编码中执行搜索.所以我找不到俄语单词。

首选解决方案将使用标准POSIX或GNU命令行实用程序(如grep)。

MC或Emacs解决方案也赞赏。

我试过：

$ grep `echo Привет | iconv -f cp1251 -t utf-8` *

但是这个命令有时不会显示结果。

emacs

internationalization

full-text-search

grep

posix

回答 1

Stack Overflow用户

发布于 2012-02-24 17:07:54

您建议的命令输出字符串Привет，然后将该输出的结果传递给iconv，并将grep应用于iconv的结果。这不是你想要的。你想要的是：

find . -type f -printf "iconv -f cp1251 -t utf-8 '%p' | grep --label '%p' -H 'Привет'\n" | sh

这适用于当前目录下的每个文件，后面跟着grep。

但是请注意，这假设您的文件的所有都在CP1251中。如果他们中的一些是这样的话，它就会失败。在这种情况下，您首先必须编写一个程序来检测文件的编码，然后只在必要时应用if。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/9290211

复制

相似问题

问在文件层次结构中的选定编码系统中搜索文本
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在文件层次结构中的选定编码系统中搜索文本EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在文件层次结构中的选定编码系统中搜索文本
EN