文章/答案/技术大牛

发布

社区首页 >问答首页 >如何获得自上次查询以来苏格拉塔苏打数据集中最近的行？

问如何获得自上次查询以来苏格拉塔苏打数据集中最近的行？
EN

Stack Overflow用户

提问于 2016-11-02 00:36:20

回答 1查看 614关注 0票数 1

我正在使用Splunk来分析SFGov开放数据(data.sfgov.org)，这是一个苏格拉塔系统。

我可以下载json的数据和分析的东西离线。我现在正在实现数据集更新的自动索引(每天)。

我试图找出自上一次投票以来，实际要使用哪些苏格拉塔API字段来获得新的记录。

我知道我可以使用$where URL选项再次过滤:created_at和:updated_at参数，但是是否存在rowID或最后一个索引之类的东西？我将在最后一次抓取的行的splunk端维护本地状态。

就像我昨晚得到的最后一行是18104，那么我会要求贴出> 18104行的行。

提前感谢！我正在使用python实现自动化。

-加上2016年2月11日

目前，我正在手动测试这种GET (使用hurl.it进行测试)。

https://data.sfgov.org/resource/nwsr-z4mh.json?$where=:created_at在“2016-10-23T18:00:00”和“2016-11-03T00:00:00”和$order=：created_at DESC&$select=:*，*

这使用了苏格拉塔数据集中的:created_at系统字段。
它正在返回在这些时间戳之间创建的记录。这似乎很管用。

所以，如果我要把它放到python中，我需要简单地保存上一个获取日期-时间，并做一个‘介于和希望得到最新创建的记录。

我更喜欢一种引用ROW#的方法，但我不知道如何使用id":"row-8aiu.d5x4~8rdi“参数。

socrata

soda

回答 1

Stack Overflow用户

发布于 2016-11-03 01:20:32

看来你已经做了正确的事了。您只需要保存最新的:created_at或:updated_at，并将其用于您的$where中进行以下查询。

不能执行$where=:updated_at > :row-...，因为行ID是标识符，而不是日期时间。

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40370699

复制

相似问题

问如何获得自上次查询以来苏格拉塔苏打数据集中最近的行？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何获得自上次查询以来苏格拉塔苏打数据集中最近的行？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何获得自上次查询以来苏格拉塔苏打数据集中最近的行？
EN