我正在学习使用神奇的enlive库来做一些网络抓取。我需要捕获一些可能部分突出显示的文本。例如,html可能如下所示:
<a href="example.com" class="usefulLink"><font color="#CC0000">Foo</font> <font color="#CC0000">Bar</font> <font color="#CC0000">Baz</font> <font color="#CC0000">Blah</font>rest of text</a>使用(select page :a.usefulLink)时结果是大量{:tag :font :attrs {...} :content {...}}
我的问题是:有没有一种简单的方法可以在没有所有其他不必要的东西的情况下找到内容的东西,或者我需要自己去做?
发布于 2011-06-20 19:00:38
您可以使用unwrap。
(-> page
(select [:a.usefulLink])
(at [:font] unwrap))https://stackoverflow.com/questions/6408274
复制相似问题