我正在尝试从pandas中的数据帧中删除括号和撇号,以便可以进一步解析时间戳,时间戳的格式为: YYYY/MM/DD:HH:MM:SS。
我使用的代码如下所示:
finallog = newerlog.split()
ts = finallog[0::6]
ip = finallog[1::6]
proxy = finallog[3::6]
refurl = finallog[4::6]
requrl = finallog[5::6]数据帧开头的错误时间戳的一个示例是:“2020/11/13:02:16:43数据帧中还有其他带有撇号的元素,例如'2020/11/14:10:14:16当然,最后一个元素的结束倒数作为开始示例。‘”
有什么关于如何删除这些的建议吗?如果我要进一步对时间戳进行切片,则时间戳的长度必须一致。
发布于 2020-11-20 02:44:24
如果你已经知道所有的错误字符:
element = '["2020/11/13:02:16:43'
clean_element = element.replace('[', '').replace('"', '').replace("'", '').replace(']', '')
>> '2020/11/13:02:16:43'https://stackoverflow.com/questions/64918001
复制相似问题