首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从R中较大的数据集中减去子集

从R中较大的数据集中减去子集
EN

Stack Overflow用户
提问于 2018-06-26 04:32:18
回答 1查看 807关注 0票数 1

大家好:我有两个变量。第一个标题是WITHOUT_VERANDAS。这是一个城市列表,按不带阳台的房屋的平均租赁价格汇总(大约有200行):

代码语言:javascript
复制
City        Price

1 Appleton    5000
2 Ames        9000
3 Lodi        1020
4 Milwaukee   2010
5 Barstow     2000
6 Chicago     2320
7 Champaign   2000  

第二个变量名为WITH_VERANDAS。这是一个城市列表,按带阳台的房屋的平均租赁价格汇总(大约有10行,这是之前数据集的子集,因为并不是每个城市都有带阳台的出租房产):

代码语言:javascript
复制
City          Price

1 Milwaukee   3000
2 Chicago     2050
3 Lodi        5000

对于WITH_VERANDAS列表中的每个城市,我希望从第一个列表中减去该城市的WITHOUT_VERANDAS城市值。我想看看哪些城市的差异最大或最小。本质上,结果应该只包含WITH_VERANDAS数据。

我试过了:

代码语言:javascript
复制
difference <- WITH_VERANDAS$Price-WITHOUT_VERANDAS$Price
View(difference)

但是,这将返回与WITHOUT_VERANDAS dataset一样多的行。我也得到了一个错误:

代码语言:javascript
复制
   longer object length is not a multiple of shorter object length

结果就是从WITH_VERANDA的第1行中减去WITHOUT_VERANDAS的第1行,如结果所示:(例如,输出的第1行是Milwaukee-Appleton的值,第2行的输出是芝加哥- Ames的值,依此类推)

代码语言:javascript
复制
 1.  -2000
 2.  -6950

如果我能过滤WITHOUT_VERANDAS,使其只包含WITH_VERANDAS中包含的城市,我想这是可行的。谢谢!

EN

回答 1

Stack Overflow用户

发布于 2018-06-26 04:57:35

R2evans,谢谢你!这样做效果很好。现在,我有:

代码语言:javascript
复制
  City          Price.x       Price.y

  1  Appleton   NA            5000
  2  Ames       NA            9000
  3  Lodi       5000          1020
  4  Milwaukee  3000          2010

我该如何过滤这个列表,以剔除Price.x为"NA“的行?即所有不匹配的行。再次感谢!

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51031395

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档