这种情况不同,我想,我有一个词,我有大约100个正则表达式。我想检查它通过了哪个正则表达式?如何以优化的方式做到这一点?
发布于 2013-08-28 17:13:33
最有效的方法是将所有这些正则表达式组合成一个确定的有限自动机(一个有限状态机)。然后在有限状态机中运行字符串。
Michael Sipser's Introduction to the Theory of Computation解释了如何做到这一点。它相当复杂,因此引用了这本书。
手动构建DFA之后,您可以在代码中实现它。
有一些工具可以为您完成此任务,例如flex。flex接受正则表达式作为输入,并将DFA生成为.c文件,然后您可以在项目中使用该文件。您可以将flex配置为返回一个令牌,以指示匹配的正则表达式。
flex是一个unix工具,是OSX10.8的一部分。
https://stackoverflow.com/questions/18479858
复制相似问题