我试图为调用方和被叫者之间的实例构造一个应急矩阵。我只是有问题,因为我的变量caller_id包含长度为5个数字的值;但是,如果值以1、2或3开头,则需要将它们分开。例如,我的数据是模式的:
CALLER CALLEE
12345 1
23456 1
35643 2其中Callee的前缀和Callee的值可以是1、2或3,代表白人族裔的1,黑人种族的2,未知的3。然后,我需要创建一个应急矩阵,例如:
White Caller Black Caller
White Callee # of calls # of calls
Black Callee # of calls # of calls
Unknown Callee # of calls # of calls如果有人对我如何分离价值和创建矩阵有任何建议,我将不胜感激。提前谢谢你。
发布于 2018-10-28 23:44:53
对于R基,您可以使用
with(df, table(CALLER = substr(CALLER, 0, 1), CALLEE))
# CALLEE
# CALLER 1 2
# 1 1 0
# 2 1 0
# 3 0 1其中,substr(df$CALLER, 0, 1)从df$CALLER中提取第一个数字(参见?substr),然后table给出应急表。
https://stackoverflow.com/questions/53037034
复制相似问题