代码如下:
<div>23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>我想要抓取生成的三行代码。
23 Anywhere Ave<br />Someplace<br />Somewhere 1234</div>分成不同的列。通过将<div>设置为前标记,将<br />设置为后标记,我可以抓取第一个字符串(23 Anywhere Ave)。在那之后就卡住了。我已经尝试将前标记设置为<div>(?=)<br />)、/<div>(?=)<br />)/ (当创建正则表达式语句时,front显然需要//)和<div>/(?=)/<br />)来获取第二个值,但没有成功。
我意识到正则表达式不适合解析超文本标记语言,但是this post表明,在Outwit体系结构中的某些上下文中,它是可以的。
发布于 2013-12-20 20:56:06
在automators/scrapers中,将此分隔符: br放入标签列表中:街道、城市、ZipCode
这是尤西比奥。
https://stackoverflow.com/questions/19185180
复制相似问题