是否有测量或比较模式与给定字符串对应的紧密程度的机制?我所说的模式是指正则表达式或类似的东西。例如,我们有字符串"foobar"和两个regexes:"fooba."和".*",这两种模式都与字符串匹配。是否可以确定“fooba”。对于给定的字符串,更合适的模式是".*“吗?
发布于 2012-02-28 16:33:30
对于字符串“距离”有度量和启发式。检查此选项,例如http://en.wikipedia.org/wiki/Edit_distance
以下是Google搜索附带的一个随机Java实现。
http://www.merriampark.com/ldjava.htm
有些度量是昂贵的计算,所以四处看看,并找到一个适合你的需要。
对于您的具体示例,IIRC,正则表达式匹配在Java中通过匹配长度来确定术语的优先级,然后排序,如果您使用类似的
“(Foobar)x(.*)”,它将与第一个匹配,您可以通过检查两个捕获组返回的结果来确定这一点。
发布于 2012-02-28 15:18:24
这个想法如何:使用正则表达式的长度:length("fooba.") > length(".*"),所以"fooba."更具体.
但是,这取决于正则表达式的来源以及您需要的精确程度,因为"fo.*|.*ba"比"fooba."长,所以解决方案并不总是有效的。
发布于 2012-02-28 16:21:25
您所要求的并不是正则表达式的真正属性。
创建一个度量“紧密性”的枚举,并创建一个包含给定正则表达式的类和一个封闭值。这要求您确定哪个正则表达式比另一个正则表达式“更接近”。
实例化您的各种类,让它们在代码中释放,并比较匹配的对象,让“最接近”的对象上升到顶部。
伪代码,实际上没有比较任何东西,或类似于任何正常的语言:
enum Closeness
Exact
PrettyClose
Decent
NotSoClose
WayOff
CouldBeAnything
mune
class RegexCloser
property Closeness Close()
property String Regex()
ssalc
var foo = new RegexCloser(Closeness := Exact, Regex := "foobar")
var bar = new RegexCloser(Closeness := CouldBeAnything, Regex := ".*")
var target = "foobar";
if Regex.Match(target, foo)
print String.Format("foo {0}", foo.Closeness)
fi
if Regex.Match(target, bar)
print String.Format("bar {0}", bar.Closeness)
fihttps://stackoverflow.com/questions/9484481
复制相似问题