我有一个由许多字符串组成的文件。对于每个字符串,我希望创建长度为4的子字符串,然后将每个子字符串与另一个SPSS文件中的单词字典进行比较。例如,如果我有字符串"transport“,我想创建一个由4个字母组成的字符串列表(例如,'tran','rans','ansp‘等)。对于这些4个字母的字符串中的每一个,我想知道它是否存在于另一个包含大量单词的文件中。下面是我在SPSS中的语法:
*rawNonword是我的第一个文件中字符串的名称。
计算字符= char.length(rawNonword)。
字符串符(A50)。
循环#i =1到chars-4。
计算持有者= char.substr(rawNonword,#i,4)。
*这里我想将holder与另一个文件中的字符串进行比较。
结束循环。
执行。
我意识到合并和匹配函数通常在SPSS中使用,但似乎不能在循环中使用它们。我相信这个问题在python中是相当简单的,但是我需要在SPSS中完成这个任务。如果4个字母的字符串存在于另一个文件中,SPSS中有没有一个简单的函数可以返回值1或true?
发布于 2013-09-14 05:06:18
使用Python插件和extendedTransforms.vlookup函数当然更容易,但在传统语法中,您可以创建一个包含所有四个字母片段的变量,对两个文件进行排序,并使用该变量作为键对匹配文件使用表匹配。
https://stackoverflow.com/questions/18772520
复制相似问题