我试图运行下面的代码来掩蔽2列中的数据,但由于以下错误而失败:
setwd("/cloud/project/CX")
Credit_tbl <-read.csv(file = 'Sample_data.csv',sep = ",",stringsAsFactors = FALSE)
anonymize <- function(x, algo="crc32"){
unq_hashes <- vapply(unique(x), function(object) digest(object, algo=algo), FUN.VALUE="", USE.NAMES=TRUE)
unname(unq_hashes[x])
}
cols_to_mask <- c("Email","Phone")
Credit_tbl[,cols_to_mask := lapply(.SD, anonymize),.SDcols=cols_to_mask,with=FALSE]错误:
[.data.frame中的错误(Credit_tbl,:=(cols_to_mask,lapply(.SD,匿名)),未使用的参数(.SDcols = cols_to_mask,with = FALSE)
发布于 2020-04-15 05:05:25
您有一个dataframe,并且正在使用data.table语法。
将dataframe转换为data.table并应用该函数。
library(data.table)
library(digest)
cols_to_mask <- c("Email","Phone")
anonymize <- function(x, algo="crc32") {
sapply(x, function(y) if(y == "" | is.na(y)) "" else digest(y, algo = algo))
}
setDT(Credit_tbl)
Credit_tbl[, (cols_to_mask) := lapply(.SD, anonymize), .SDcols = cols_to_mask]在不更改为data.table的情况下,可以使用lapply应用该函数:
Credit_tbl[cols_to_mask] <- lapply(Credit_tbl[cols_to_mask], anonymize)https://stackoverflow.com/questions/61220289
复制相似问题