首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >日期字段上的数据质量

日期字段上的数据质量
EN

Stack Overflow用户
提问于 2017-04-07 20:15:41
回答 1查看 507关注 0票数 2

我在处理字符串格式的日期字段时遇到了问题,所以我试图对基础进行清理。我的基中的默认格式日期字符串是"%d/%m/%Y",但是由于这来自csv文件,可能存在一些不需要的字符串。当我试图用以下方法进行解析时,我会遇到错误:

代码语言:javascript
复制
parse_date('%d/%m/%Y',trim(e.checkin))

就像这样,但是每次我运行时都会得到一个新的问题字符:

代码语言:javascript
复制
 Illegal non-space trailing data '�' in string "25/07/201€" 

处理这件事最好的方法是什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-04-07 20:38:26

解决这个问题的核心是识别那些带有“断开”checkin字段的行。

然后,您可以跳过下面这样的处理

代码语言:javascript
复制
#standardSQL
WITH e AS (
  SELECT '25/07/201€' AS checkin UNION ALL
  SELECT '25/07/2016'
)
SELECT 
  checkin AS checking_string, 
  PARSE_DATE('%d/%m/%Y',TRIM(e.checkin)) AS checking_date
FROM e
WHERE REGEXP_CONTAINS(e.checkin, r'^(\d){2}/(\d){2}/(\d){4}$')

或者你可以用某种方式来处理这些破碎的价值观。

在任何情况下,使用WHERE REGEXP_CONTAINS(e.checkin, r'^(\d){2}/(\d){2}/(\d){4}$')方法都可以控制情况

希望这能给你足够的方向

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43286439

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档