cat doc.txt和以下字符将显示:
你好 Hello!
这是中文。This is a Chinese doc.我可以使用命令
wc -w doc.txt
但它将显示:
8 doc.txt这个命令将字符你好和这是中文都作为一个单词,而实际上你好是两个中文单词,这是中文 4。
我想要的是让这些中文单词计算正确(例子中有12个单词),有人能帮上忙吗?
发布于 2016-11-06 01:33:48
您可以使用-m或--chars选项:
$ echo -n "你好" | wc -m 输出:
2https://stackoverflow.com/questions/31563546
复制相似问题