我试图将通配符形式("*word*")中的用户输入更改为正则表达式格式。为此,我使用下面的代码删除输入开头和结尾处的'*',以便在任何一端添加正则表达式字符:
string::iterator iter_begin = expressionBuilder.begin();
string::iterator iter_end = expressionBuilder.end();
iter_end--;
if ((char)*iter_begin == '*' && (char)*iter_end == '*')
{
expressionBuilder.erase(iter_begin);
expressionBuilder.erase(iter_end);
expressionBuilder = "\\b\\w*" + expressionBuilder + "\\w*\\b";
}但是,对"expressionBuilder.erase(iter_end)"的调用不会从输入字符串中删除尾随的'*',因此我最终得到了一个不正确的正则表达式。我在这里做错了什么?如果if语句中的代码要运行(它确实是这样的),那么为什么相同的迭代器在传递擦除()时不能工作呢?
发布于 2008-10-23 19:43:46
试着用相反的顺序擦除它们:
expressionBuilder.erase(iter_end);
expressionBuilder.erase(iter_begin);在删除第一个*之后,iter_end引用示例中字符串结束后的一个字符。STL文档表明迭代器被erase()失效,所以从技术上讲,我的例子也是错误的,但我相信它在实践中会奏效。
发布于 2008-10-23 20:39:42
到目前为止,您的原始代码和建议的解决方案除了您发布的显而易见的问题外,还存在一些问题:
现在,如果使用代码段/例程的代码已经确认字符串至少有2个字符,那么最后两个项可能并不是一个问题,但如果情况不是这样,我相信对于expressionBuilder的任意值,下面的代码会更加健壮:
// using the reverse iterator rbegin() is a nice easy way
// to get the last character of a string
if ( (expressionBuilder.size() >= 2) &&
(*expressionBuilder.begin() == '*') &&
(*expressionBuilder.rbegin() == '*') ) {
expressionBuilder.erase(expressionBuilder.begin());
// can't nicely use rbegin() here because erase() wont take a reverse
// iterator, and converting reverse iterators to regular iterators
// results in rather ugly, non-intuitive code
expressionBuilder.erase(expressionBuilder.end() - 1); // note - not invalid since we're getting it anew
expressionBuilder = "\\b\\w*" + expressionBuilder + "\\w*\\b";
}请注意,当expressionBuilder为""、"*"或"**"时,该代码将工作,因为它不执行任何未定义的操作。然而,在这些情况下,它可能不会产生您想要的结果(这是因为我不知道您在这些情况下到底想要什么)。修改以适应您的需要。
发布于 2008-10-23 19:46:17
(修改后,我错过了iter_end--行)。
您可能需要一个只检查是否为*iter_begin == '*'的if语句,然后调用find()来获取另一个'*'。或者您可以使用rbegin()来获得“序列的起始迭代器反向”,将其提前一个,然后调用base()将其转换为常规迭代器。这会让你成为序列中的最后一个角色。
更好的是,std::string拥有方法。他们会给你最后一个'*'。您也可以简单地调用replace(),而不是去掉'*',然后再添加新的内容。
https://stackoverflow.com/questions/231146
复制相似问题