我通过使用以下命令向pandas读取rpt数据:
import pandas as pd
df = pd.read_fwf("2014-1.rpt", skiprows=[1], nrows=150)我实际上遵循了anwser here,但是,对于某些列,分隔并不准确。这是我得到的示例:
Country Order Date Device Category
UK 2014-01-03 Desktop Shoes
IT 2014-01-03 Desktop Shoes
FR 2014-01-04 Desktop Dress
FR 2014-01-04 Tablet Dress
US 2014-01-05 Desktop Bags
US 2014-01-06 Desktop Bags
UK 2014-01-07 Tablet Dress例如,它将Order、Date和Device列作为单个列读取。实际上,这只是一个例子,有很多这样的列。如何解决?你有什么想法吗?实际上,这些有问题的列可能具有固定的宽度
发布于 2018-02-24 01:54:17
这个问题很老了,但这里有一个答案。您可以使用pandas将其作为csv阅读。我已经将它用于各种rpt文件,并且它已经起作用了。
import pandas as pd
df = pd.read_csv("2014-1.rpt", skiprows=[1], nrows=150)https://stackoverflow.com/questions/47685206
复制相似问题