首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在航班数据库中使用min_rank?

如何在航班数据库中使用min_rank?
EN

Data Science用户
提问于 2018-12-15 18:03:29
回答 2查看 1.5K关注 0票数 0

我正在探索数据科学手册的https://r4ds.had.co.nz/transform.html#add-new-variables-with-mutate r,并不真正理解min_rank()操作符。在做这个练习的时候,它要求使用一个排名函数来找出最晚的10次航班。你想怎样处理领带?仔细阅读min_rank()的文档。

下面是我执行的不起作用的代码。请解释:

代码语言:javascript
复制
min_rank(flights, dep_delay)
EN

回答 2

Data Science用户

回答已采纳

发布于 2018-12-16 01:07:17

您可以将min_rank的结果放入一个新的列中,例如:

代码语言:javascript
复制
f2 <- flights %>% 
  mutate(rank = min_rank(dep_delay))

其中只显示选定的行:

代码语言:javascript
复制
f2 %>% 
  select(dep_delay, rank)

你明白这个:

代码语言:javascript
复制
# A tibble: 336,776 x 2
   dep_delay   rank
       <dbl>  <int>
 1         2 208140
 2         4 219823
 3         2 208140
 4        -1 164763
 5        -6  48888
 6        -4  94410
 7        -5  69589
 8        -3 119029
 9        -3 119029
10        -2 143247
# ... with 336,766 more rows

这里是另一个例子,您可以看到所有的行。

代码语言:javascript
复制
aa <- tibble(y = c(9, 8, 3, 4, 5, 7, 6),
             x = c(1, 2, 3, 4, 4, 4, 5))

aa %>% 
  mutate(rank = min_rank(y))

这给了我们:

代码语言:javascript
复制
# A tibble: 7 x 3
      y     x  rank
  <dbl> <dbl> <int>
1     9     1     7
2     8     2     6
3     3     3     1
4     4     4     2
5     5     4     3
6     7     4     5
7     6     5     4
票数 1
EN

Data Science用户

发布于 2023-02-27 08:42:42

我就这样解决了:

代码语言:javascript
复制
mutated = mutate(flights, total_delay = dep_delay + arr_delay)
arrange(mutated, desc(total_delay))

基本上,通过这样做,您可以创建一个新的colum,其总延迟以分钟为单位,使用arange按总延迟时间对数据进行排序。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/42681

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档