我不是RegEx专家。我需要从HTML表中提取一个特定的数字。
举个例子:
<td>13</td><td>
</td><td align="right">29.543</td>
<td align="right">1.777</td>
<td align="right">2.588</td>
</tr><tr><td><a href="player.php?p=84668" >Caterdamus</a></td>
<td>7</td><td>
Meister</td><td align="right">9.874</td>
<td align="right">1.716</td>
<td align="right">5.791</td>
</tr><tr><td><a href="player.php?p=87216" >grappa</a></td>
<td>2</td><td>
</td><td align="right">1.044</td>
<td align="right">21</td>
<td align="right">146</td>
</tr></table>该模式如下所示:
<td>13</td><td>
<td>7</td><td>
<td>2</td><td>如何从文本中提取数字并将其存储到变量中。提示:这些数字是正整数。
谢谢:)
发布于 2009-10-21 20:41:14
我不会使用正则表达式来解析HTML或XML。相反,我会将文档加载到HTML DOM解析器中-您可以使用find several open source ones here。我不能保证其中任何一项--我从来没有在Java中使用过除XML之外的任何东西。
发布于 2009-10-21 20:39:42
我不是很了解java正则表达式,但我建议这样做
/<td>(\d+)<\/td><td>/因为正则表达式的语法在多种语言中非常相似。
解释
( ... digit+捕获正则表达式的返回值中的内容)表示一个令牌在其左侧中的一个或多个实例的停留
因为您只使用正整数,所以不必关心符号和小数点。
发布于 2009-10-21 20:39:19
<td>(\d+)</td>应该能胜任这项工作。
https://stackoverflow.com/questions/1600522
复制相似问题