首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何列出每个单词一次?忽略非字母字符

如何列出每个单词一次?忽略非字母字符
EN

Stack Overflow用户
提问于 2017-03-16 09:41:35
回答 2查看 68关注 0票数 0

Unix诞生于1969年,来自贝尔实验室的计算机科学家Ken Thompson。Unix是在一台经过清理的PDP-7小型机上诞生的

代码语言:javascript
复制
 tr -cs "[:alpha:]" "\n" < file | sort -u 

结果看起来不错,但我发现了一个问题,原文中的"PDP-7“变成了"PDP”,我不确定是否应该添加更多的参数?

EN

回答 2

Stack Overflow用户

发布于 2017-03-16 09:59:18

这似乎符合您的要求(并不是说这是一个格式良好的问题):

代码语言:javascript
复制
sed -r  's/[[:space:]]/\n/g' unix | sed -r 's/[^a-zA-Z0-9]//g' | sort -u
1960s
1962
1969
a
actual
almost
also
an
and
at
barely
batch
beasts
been
Bell
born
But
by
computer
computing
concept
deployment
earlier
else
everywhere
experience
experimental
first
for
had
him
in
inventor
it
John
Ken
Laboratories
language
late
Lisp
McCarthy
mind
Multics
novel
of
on
one
operating
out
primitive
project
researcher
rule
scientist
seven
speculations
spoiled
still
systems
temperamental
ten
that
the
Thompson
timesharing
Unix
uttered
was
were
which
years
票数 1
EN

Stack Overflow用户

发布于 2017-03-16 12:16:33

请记住在使用uniq -u之前使用排序,例如:

代码语言:javascript
复制
sort | uniq -u

如果你只想保留字母,你也可以输入以下内容:

代码语言:javascript
复制
sed "s/[[:digit:].-]//g"

希望这能有所帮助。有一个你的代码/列表的例子会很棒。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42823841

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档