首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中的数据匿名化

R中的数据匿名化
EN

Stack Overflow用户
提问于 2020-04-15 02:23:24
回答 1查看 1.3K关注 0票数 1

我试图运行下面的代码来掩蔽2列中的数据,但由于以下错误而失败:

代码语言:javascript
复制
setwd("/cloud/project/CX")

Credit_tbl <-read.csv(file = 'Sample_data.csv',sep = ",",stringsAsFactors = FALSE)

anonymize <- function(x, algo="crc32"){
  unq_hashes <- vapply(unique(x), function(object) digest(object, algo=algo), FUN.VALUE="", USE.NAMES=TRUE)
  unname(unq_hashes[x])
}

cols_to_mask <- c("Email","Phone")

Credit_tbl[,cols_to_mask := lapply(.SD, anonymize),.SDcols=cols_to_mask,with=FALSE]

错误:

[.data.frame中的错误(Credit_tbl,:=(cols_to_mask,lapply(.SD,匿名)),未使用的参数(.SDcols = cols_to_mask,with = FALSE)

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-04-15 05:05:25

您有一个dataframe,并且正在使用data.table语法。

将dataframe转换为data.table并应用该函数。

代码语言:javascript
复制
library(data.table)
library(digest)

cols_to_mask <- c("Email","Phone")

anonymize <- function(x, algo="crc32") {
    sapply(x, function(y) if(y == "" | is.na(y)) "" else digest(y, algo = algo))
}

setDT(Credit_tbl)
Credit_tbl[, (cols_to_mask) := lapply(.SD, anonymize), .SDcols = cols_to_mask]

在不更改为data.table的情况下,可以使用lapply应用该函数:

代码语言:javascript
复制
Credit_tbl[cols_to_mask] <- lapply(Credit_tbl[cols_to_mask], anonymize)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61220289

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档