首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >iOS Hpple HTML解析

iOS Hpple HTML解析
EN

Stack Overflow用户
提问于 2015-07-08 23:51:06
回答 1查看 254关注 0票数 0

我需要在我的应用程序中将网站的内容解析为一个表视图。我试过hpple,在一些测试案例中,它有效。但在我的特殊情况下我不能让它起作用..。HTML:

代码语言:javascript
复制
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html>
   <head>
      <link rel="stylesheet" type="text/css" href="willi.css">
      </link><script src="style.js" type="text/javascript"></script>
      <title>Homepage</title>
   </head>
   <body>
      <a name="oben"/>
         <h1>Date</h1>
         <br />
      <a href="#07.07.2015">07.07.2015</a><br />
      <a href="#07.08.2015">07.08.2015</a><br />
      <a name="07.07.2015">
         <hr />
      </a>
      <p class="page" style="text-align:left">
      <h2>Date Tue, 7.7.2015</h2>
      created: 7.7. 16:35 </p>
      <p class="page" style="text-align:left">
      <table class="F" border-width="3">
         <colgroup>
            <col width="899"/>
         </colgroup>
         <tr class="F">
            <th rowspan="1" class="F">
               ***&nbsp;&nbsp; Version 1&nbsp;&nbsp; ***
            </th>
         </tr>
         <tr class="F">
            <th rowspan="1" class="F"></th>
         </tr>
         <tr class="F">
            <th rowspan="1" class="F">
               Testmessage 1
            </th>
         </tr>
         <tr class="F">
            <th rowspan="1" class="F">
               Testmessage 2
            </th>
         </tr>
         <tr class="F">
            <th rowspan="1" class="F">
               Testmessage 3
            </th>
         </tr>
         <tr class="F">
            <th rowspan="1" class="F"></th>
         </tr>
         <tr class="F">
            <th rowspan="1" class="F">
               Testmessage 4
            </th>
         </tr>
      </table>
      </p>
      <p class="seite" style="text-align:left">
      <h4>List:</h4>
      <table class="k" border-width="3">
         <tr>
            <th width="50">
               Team
            </th>
            <th width="50">
               &nbsp;Name
            </th>
            <th width="50">
               Nr.
            </th>
            <th width="50">
               &nbsp;Mate
            </th>
            <th width="50">
               Spot
            </th>
            <th width="50">
               &nbsp;Map
            </th>
            <th width="150"></th>
         </tr>
         <tr class="k">
            <th rowspan="5" class="k">
               A
            </th>
            <td>
               &nbsp;First
            </td>
            <td>
               3
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Second
            </td>
            <td>
               4
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Sie
            </td>
            <td>
               8
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Sie
            </td>
            <td>
               9
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Es
            </td>
            <td>
               10
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr class="k">
            <th rowspan="1" class="k">
               B
            </th>
            <td>
               &nbsp;Red
            </td>
            <td>
               11
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
      </table>
      </p>
      <hr />
      <a name="07.08.2015">
         <hr />
      </a>
      <p class="page" style="text-align:left">
      <h2>Date Thu, 8.7.2015</h2>
      created: 7.7. 16:35 </p>
      <p class="page" style="text-align:left">
      <table class="F" border-width="3">
         <colgroup>
            <col width="899"/>
         </colgroup>
         <tr class="F">
            <th rowspan="1" class="F">
               ***&nbsp;&nbsp; Version 1&nbsp;&nbsp; ***
            </th>
         </tr>
      </table>
      </p>
      <p class="page" style="text-align:left">
      <h4>List:</h4>
      <table class="k" border-width="3">
         <tr>
            <th width="50">
               Team
            </th>
            <th width="50">
               &nbsp;Name
            </th>
            <th width="50">
               Nr.
            </th>
            <th width="50">
               &nbsp;Mate
            </th>
            <th width="50">
               Spot
            </th>
            <th width="50">
               &nbsp;Map
            </th>
            <th width="150"></th>
         </tr>
         <tr class="k">
            <th rowspan="5" class="k">
               C
            </th>
            <td>
               &nbsp;Dnk
            </td>
            <td>
               1
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Es
            </td>
            <td>
               1
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Dnk
            </td>
            <td>
               2
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;Esta
            </td>
            <td>
               2
            </td>
            <td>
               &nbsp;
            </td>
            <td></td>
            <td>
               &nbsp;
            </td>
            <td>
               &nbsp;Test
            </td>
         </tr>
         <tr>
            <td>
               &nbsp;SWB
            </td>
            <td>
               6
            </td>
            <td>
               &nbsp;Naau
            </td>
            <td>
               F
            </td>
            <td>
               &nbsp;Test
            </td>
            <td>
               &nbsp;
            </td>
         </tr>
      </table>
      </p>
      <hr />
   </body>
</html>

该页面包含两个主要元素(<table></table>),我希望使用这些元素填充UITableView。

我的目标是每个表都有一个部分,每个部分中都有表的所有内容。节标题名称应该是“日期”。

代码语言:javascript
复制
TFHpple *Parser = [TFHpple hppleWithHTMLData:HtmlData];

NSString *XpathQueryString = @"/html/body/a";
NSArray *Nodes = [Parser searchWithXPathQuery:XpathQueryString];

for (TFHppleElement *element in Nodes) {
    NSString *temp = [[element firstChild] content];
    if (temp.length == 10) {
        [Day addObject:temp];
    }
}

在我的NSMutableArray *Day中,我保存日期,这很好。我得到了两部分正确的名字。但当我试图接收表格内容时,我无法让它起作用.我想要像这样的

代码语言:javascript
复制
tableElement* newElement = [[tableElement alloc] init];
newElement.day = @"07.07.2015";
newElement.team = @"A";
newElement.name = @"First";
newElement.nr = @"3";
newElement.mate = @"";
newElement.spot = @"";
newElement.map = @"";
newElement.status = @"Test";

然后,我可以在一个数组中存储日期的所有newElement (s),在另一个元素中存储date的所有元素。

编辑:例如,newElement.day = @"07.07.2015";当然需要类似于newElement.day = [[hppleparse firstChild] content];

EN

回答 1

Stack Overflow用户

发布于 2016-01-05 23:51:38

这可以很容易地通过HTMLKit实现。

下面是使用您提供的HTML可以使用它的几个示例:

代码语言:javascript
复制
HTMLDocument *document = [HTMLDocument documentWithString:html];
NSMutableArray *days = [ NSMutableArray array];
NSArray *links = [document querySelectorAll:@"a"];
for (HTMLElement *link in links) {
  if (link.textContent.length == 10) {
    [days addObject:link.textContent];
  }
}

// For example you can:
// Get all <tr> elements that are children of the table with className 'k'
NSArray *tableKRows = [document querySelectorAll:@"table.k > tr"];

// Get all <td> elements that are descendants of the table with className 'k'
NSArray *tableKData = [document querySelectorAll:@"table.k td"];

// Collect content of all <td> elements in `array`
NSMutableArray *array = [NSMutableArray array];
for (HTMLElement *td in tableKData) {
  NSString *content = [td.textContent stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceAndNewlineCharacterSet]];
  [array addObject:content];
}

如果你需要进一步的帮助,请告诉我。

HTMLKit是一个纯目标C的HTML解析器,支持CSS3选择器。它不是libxml或任何其他库的包装器,而是一个完整的符合WHATWG HTML规范的实现。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31305804

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档