首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >数据提取

数据提取
EN

Stack Overflow用户
提问于 2014-06-20 12:06:26
回答 1查看 80关注 0票数 0

因为我玩了一些nodejs和快递的东西,我遇到了一些问题。

我有一些html的东西可用,并希望提取一些数据到一个数组。我能够超越一些基本的东西,但一些更详细的数据,我有困难来解决它。

以下是我的html部分:

代码语言:javascript
复制
<hr>
<h1>Topic</h1>
written by&nbsp;<font color=#ffffff>sCHween</font>&nbsp;&nbsp;am&nbsp;18.06.2014&nbsp;at&nbsp;21:26:15
<hr>
This is my test to extract some data!
<hr>

以下是我认为我可以

代码语言:javascript
复制
jsdom.env({
html: body,
scripts: ['http://code.jquery.com/jquery-2.1.1.min.js'],
done: function(errors, window) {
var $ = window.jQuery;
$body = $(iconv.decode(new Buffer(body), "ISO-8859-1")),

self.items[0] ={
  topic: $body.find('h1:eq(1)').text(),
  author: $body.find('font[color=#ffffff]').first().text(),
  date: {should be 18.06.204},
  time: {should be 21.26.15},
  text: $body.find('hr:eq(1)').nextSibling
}

console.log(self.items);
res.end('');
}

我的问题:

我不知道怎样才能更接近日期和时间?我怎样才能在两个小时标签之间得到文本呢?

对我来说,我不期望一个完成的解决方案-我更希望你能给我一些想法,我如何能够实现我的目标。

非常感谢&祝您愉快,sCHween

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-20 12:46:56

代码语言:javascript
复制
<hr>
<h1>Topic</h1>
<b>written by&nbsp;<font color=#ffffff>sCHween</font>&nbsp;&nbsp;am&nbsp;18.06.2014&nbsp;at&nbsp;21:26:15</b>
<hr>
<i>This is my test to extract some data!</i>
<hr>
<p></p> 

具有定义不明确的功能。一定有点像我的例子

代码语言:javascript
复制
   var topic= $('h1:eq(0)').text(),
      author= $('font[color=#ffffff]').first().text(),
      text= $('i:eq(0)').text(),
      date=$('b').text().match(/(\d+)/g);
    var myArray = [ topic, author, text ];
    console.log( myArray);
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24326883

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档