首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何处理关闭集超出可接受范围的时间戳字段

如何处理关闭集超出可接受范围的时间戳字段
EN

Stack Overflow用户
提问于 2019-12-15 05:46:08
回答 1查看 1.1K关注 0票数 1

我在数据帧中有一个带有偏移量的ISO时间的字段:

代码语言:javascript
复制
pages[['dimension1', 'dimension3']].head()
               dimension1                     dimension3
  1572461291083.sanyrqy8   2019-10-30T14:45:42.71-04:00

大多数行都很好,但有些行在24小时外设置了一个断点。

代码语言:javascript
复制
x = pd.to_datetime(pages.dimension3)

ValueError:偏移量必须严格地介于-timedelta(hours=24)和timedelta(hours=24)之间。

下面是一个导致此错误的流氓数据点的示例:

代码语言:javascript
复制
2019-11-11T07:08:09.640-31:00

我目前的任务不是解决为什么数据以这种方式存在,而是简单地将原始数据输入Postgres。

在这个领域中,如果偏移量大于24,我可以在使用to_datetime()时告诉熊猫,如果偏移量大于24,我是否可以使用其他逻辑将其更改为24?这将将上面的流氓示例更改为2019-11-11T07:08:09.640-24:00

我怎么能和潘达斯一起这么做?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-12-15 08:44:45

使用丁香醇。它很适合分析会产生错误的日期

代码语言:javascript
复制
import dateutil                                                                                                                                                                     

dateutil.parser.parse('2019-10-30T14:45:42.71-04:00')                                                                                                                               
# datetime.datetime(2019, 10, 30, 14, 45, 42, 710000, tzinfo=tzoffset(None, -14400))

dateutil.parser.parse('2019-11-11T07:08:09.640-31:00')                                                                                                                              
# datetime.datetime(2019, 11, 11, 7, 8, 9, 640000, tzinfo=tzoffset(None, -111600))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59341501

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档