我感兴趣的是将Record-Linkage包中的levenshteinSim函数应用于字符串向量(关于here函数有很好的讨论)。
假设我有一个名为codes:"A","B","C","D"等的向量,还有一个名为tests:"A","B","C","D"等的向量。
使用sapply对codes向量进行“测试”中的特定值测试,
sapply(codes,levenshteinSim,str2=tests[1])我希望得到一个列表或向量(如果我犯了术语错误,我很抱歉):[score1] [score2] [score3]。
不幸的是,输出是对tests[1]中的值与c("A","B","C","D", ...) --一个单一值的测试。
最终,我想要*apply两个向量相互对抗,产生一个长度为len1*len2的矩阵--但是我不想继续前进,直到我明白了我做错了什么。
有人能提供指导吗?
发布于 2013-11-05 23:54:42
我不知道问题出在哪里:
library(RecordLinkage)
sapply(codes,levenshteinSim,str2=test)
A B C D
[1,] 1 0 0 0
[2,] 0 1 0 0
[3,] 0 0 1 0
[4,] 0 0 0 1当str2只是一个项目时,你会得到一个长度为4的向量。
https://stackoverflow.com/questions/19801054
复制相似问题