因此,要验证一个字符串是另一个字符串的子集,在python中,您可以使用set/frozensets类和issubset方法-仅适用于单个字符,也可以使用正则表达式,这基本上是从行首开始的多个先行断言。我想使用regex选项。
如果不像下面这样做(使用遍历字符串和手动创建先行断言,这可能会在我将处理的大数据的情况下生成一个巨大的字符串),有没有其他方法可以以更简洁/直接的方式构建这种先行?另一项是,我将不会只使用单个字符。因此,所需的先行断言的数量可能会变得非常大。
import re
userInput = raw_input()
listOfChars = 'asdfgei'
myRegexString = ''
for i in listOfChars:
myRegexString = myRegexString+'(?=.*'+i+')'
myRegexCompiled = re.compile(myRegexString)
if myRegexCompiled.(userInput):
print True发布于 2016-07-27 11:21:25
如果要验证集合中的所有字符序列是否都出现在给定的字符串中,请使用带有生成器表达式的all():
answer = all(word in string for word in bag)发布于 2016-07-27 11:20:52
假设您有两个字符串-- userInput,它可能非常大,而listOfChars,它相对较小。您希望检查userInput中是否存在listOfChars的每个元素,而不是将userInput转换为set。
这不需要使用正则表达式--这样做会更快:
userInput = raw_input()
listOfChars = 'asdfgei'
def containsSubset(large, small):
for element in set(small): # Convert to a set to remove dupes
if not large.contains(element):
return False
return True
return containsSubset(userInput, listOfChars)这将是O(M * N),其中M是userInput的大小,N是listOfChars的大小。
https://stackoverflow.com/questions/38603046
复制相似问题