我正在探索数据科学手册的https://r4ds.had.co.nz/transform.html#add-new-variables-with-mutate r,并不真正理解min_rank()操作符。在做这个练习的时候,它要求使用一个排名函数来找出最晚的10次航班。你想怎样处理领带?仔细阅读min_rank()的文档。
下面是我执行的不起作用的代码。请解释:
min_rank(flights, dep_delay)发布于 2018-12-16 01:07:17
您可以将min_rank的结果放入一个新的列中,例如:
f2 <- flights %>%
mutate(rank = min_rank(dep_delay))其中只显示选定的行:
f2 %>%
select(dep_delay, rank)你明白这个:
# A tibble: 336,776 x 2
dep_delay rank
<dbl> <int>
1 2 208140
2 4 219823
3 2 208140
4 -1 164763
5 -6 48888
6 -4 94410
7 -5 69589
8 -3 119029
9 -3 119029
10 -2 143247
# ... with 336,766 more rows这里是另一个例子,您可以看到所有的行。
aa <- tibble(y = c(9, 8, 3, 4, 5, 7, 6),
x = c(1, 2, 3, 4, 4, 4, 5))
aa %>%
mutate(rank = min_rank(y))这给了我们:
# A tibble: 7 x 3
y x rank
<dbl> <dbl> <int>
1 9 1 7
2 8 2 6
3 3 3 1
4 4 4 2
5 5 4 3
6 7 4 5
7 6 5 4发布于 2023-02-27 08:42:42
我就这样解决了:
mutated = mutate(flights, total_delay = dep_delay + arr_delay)
arrange(mutated, desc(total_delay))基本上,通过这样做,您可以创建一个新的colum,其总延迟以分钟为单位,使用arange按总延迟时间对数据进行排序。
https://datascience.stackexchange.com/questions/42681
复制相似问题