我被赋予了一个不明确的任务,那就是从各种可视化FoxPro表中自动提取数据。
有几对.DBF和.CDX文件。使用Python dbf包,我似乎能够使用它们。我有两个文件,一个是ABC.DBF,一个是ABC.CDX。我可以使用以下命令加载表文件:
>>> import dbf
>>> table = dbf.Table('ABC.DBF')
>>> print(table[3])
0 - table_key : '\x00\x00\x04'
1 - field_1 : -1
2 - field_2 : 0
3 - field_3 : 34
4 - field_ 4 : 2
...
>>>我的理解是.cdx文件是索引。我怀疑这与table_key字段相对应。According to the author、dbf可以读取索引:
我可以读取IDX文件,但不能更新它们。我的日常工作改变了,dbf文件在新的工作中不是很大的一部分。-伊森·福尔曼5月26日,16:05
阅读是我所需要做的一切。我看到有四个类:Idx、Index、IndexFile和IndexLocation。这些似乎是很好的候选者。
Idx类读入一个表和文件名,这是很有前途的。
>>> index = dbf.Idx(table, 'ABC.CDX')不过,我不确定如何使用这个对象。我看到它有一些生成器,backward和forward,但是当我尝试使用它们时,我得到一个错误
>>> print(list(index.forward()))
dbf.NotFoundError: 'Record 67305477 is not in table ABC.DBF'如何将.cdx索引文件与.dbf表相关联?
发布于 2018-05-31 08:19:41
.idx和.cdx不同,dbf当前无法读取.cdx文件。
如果需要对表进行排序,可以创建一个内存中的索引:
my_index = table.create_index(key=lambda r: r.table_key)您还可以创建一个完整的函数:
def active(rec):
# do not show deleted records
if is_deleted(rec):
return DoNotIndex
return rec.table_key
my_index = table.create_index(active)然后循环遍历索引而不是表:
for record in my_index:
...https://stackoverflow.com/questions/50614727
复制相似问题