首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R对大型数据集选定列中的字符串进行推算

R对大型数据集选定列中的字符串进行推算
EN

Stack Overflow用户
提问于 2020-01-30 01:40:04
回答 1查看 132关注 0票数 0

我正在为R中的多个数据补偿包而苦苦挣扎,需要您的建议。

我有一个150.000行270列的数据集。

每一列都有一些缺失的数据,但我只需要对其中的7列进行估算。我需要在填充这7列时考虑所有的列。没有数字数据,只有字符串。

我试过使用鼠标,但由于中断,耗时太长,没有给出任何结果。我相信我的编码完全错了。

代码语言:javascript
复制
A                  |  B          |  C           |  D        |  E       | 
------------------------------------------------------------------------
DEEP DIGGING ALL   |  1989       |  Digging     |  Sumer    |  Cups    |
SURFACE DIGGING    |  1989       |  N/A         |  Sumer    |  Glasses |
CLAIMS OFFSHORE    |  1990       |  N/A         |  Assyria  |  N/A     | 
OFFSHORE CLAIMS    |  1990       |  Offshore    |  Assyria  |  N/A     |  
CLAIMS OFFSHORE    |  1990       |  Offshore    |  Assyria  |  Cups    |
OFFSHORE CLAIMS    |  1990       |  Offshore    |  Assyria  |  Cups    |

我试图得到的是表,其中列"C“是根据所有列计算的,但列"E”中的N/As被忽略。

理想的结果:

代码语言:javascript
复制
A                  |  B          |  C           |  D        |  E       | 
------------------------------------------------------------------------
DEEP DIGGING ALL   |  1989       |  Digging     |  Sumer    |  Cups    |
SURFACE DIGGING    |  1989       |  Digging     |  Sumer    |  Glasses |
CLAIMS OFFSHORE    |  1990       |  Offshore    |  Assyria  |  N/A     | 
OFFSHORE CLAIMS    |  1990       |  Offshore    |  Assyria  |  N/A     |  
CLAIMS ONSHORE     |  1990       |  Offshore    |  Assyria  |  Cups    |
OFFSHORE CLAIMS    |  1990       |  Offshore    |  Assyria  |  Cups    |

我不确定“鼠标”是否是好的途径,但我在"missForest“中的尝试没有取得任何进展。所以我真的很依赖你的帮助。

首先要感谢大家!

EN

回答 1

Stack Overflow用户

发布于 2020-01-30 01:45:16

我们可以从tidyr使用fill

代码语言:javascript
复制
library(dplyr)
library(tidyr)
df1 %>%
   group_by(B) %>%
   fill(C, .direction = 'updown')
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59972721

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档