我在这里搜索过,找不到任何答案。import.io api的某些列不返回任何数据。这些数据在javascript后面,但是在培训期间它会返回数据,但是在批量提取或爬行期间,列是空的。我邮寄了import.io的支持,他们让我在这里张贴我的问题。有谁可以帮我?
发布于 2016-03-22 15:29:30
如果您查看页面的HTML,即使没有JS,也可以在html中的"days to go“附近看到一个属性。
例如:
data-hours-remaining="532.6704760581918"
以及:
data-end_time="2016-04-13T16:00:00-04:00"
我认为这与“走的日子”的案文相对应。
使用自定义xpath (例如:.//*[@id='project_duration_data']/@data-hours-remaining )从这些属性中获取您想要的数据。然后,你可以将它们后处理成你想要的任何格式;天、周等。
https://stackoverflow.com/questions/36155614
复制相似问题