我正在清理一个数据集,并偶然发现了以下内容:我有一个包含612个观察值的dataset。我想过滤掉每一个包含短语"admin“的刷新。所以我有以下代码:
DataSet_Cleaned <- DataSet %>%
filter(str_detect(refurl, "admin", negate = TRUE))DataSet_Cleaned现在包括611个观察值。我现在想知道哪个观察值被删除了,所以我反转了它:
DataSet_Cleaned <- DataSet %>%
filter(str_detect(refurl, "admin", negate = FALSE))新的DataSet有0个观测值。因此,这里似乎有些可疑。有人能告诉我发生了什么事吗?手动查找包含"admin“的an条目没有得到任何结果(这使得这个问题不那么紧迫),但我对这里发生的事情感到厌倦。
如果我通过否定查询,也会发生同样的情况!
DataSet_Cleaned <- DataSet %>%
filter(!str_detect(refurl, "admin"))谢谢!-Jan
发布于 2020-07-24 22:01:22
我发现了问题:其中一个refurl值是N/A,它被删除了。
https://stackoverflow.com/questions/63070067
复制相似问题