我有一个像这样的html内容。
<body>
<div>
WINDOW<br/>
DOOR<br/>
</div>
</body>我想提取的文本内容在div tag.For这个例子,我想获得文本WINDOW\nDOOR。
所以我写了下面的代码。
NSString *html = ...;
TFHpple *parser = [[TFHpple alloc]initWithHTMLData:[html dataUsingEncoding:NSUTF8StringEncoding]];
TFHppleElement *div = [parser searchWithXPathQuery:@"//div"][0];
NSString *text = [div text];它并不像我预想的那样工作。以上代码的text结果仅为WINDOW。不管怎么说,DOOR已经不见了。
然后我挣扎了很多,写了更多的代码。
NSString *html = ...;
TFHpple *parser = [[TFHpple alloc]initWithHTMLData:[html dataUsingEncoding:NSUTF8StringEncoding]];
TFHppleElement *div = [parser searchWithXPathQuery:@"//div"][0];
NSString *text = [div raw];
text = [self stringByStrippingHTML:text];我得到了原始的html内容,然后去掉了所有的html标签,得到了我所期望的结果。但是这个方法看起来有点丑陋。
所以,我的问题是,有没有一种方法可以获取html标记中的所有文本内容?
谢谢你的帮助。
发布于 2014-06-13 23:03:23
试试这个:https://github.com/topfunky/hpple
Hpple: XPathQuery库上一个很好的Objective-C包装器,用于解析HTML.
https://stackoverflow.com/questions/22138126
复制相似问题