文章/答案/技术大牛

发布

社区首页 >问答首页 >在Python中使用pickle高效地访问字典中的项目

问在Python中使用pickle高效地访问字典中的项目
EN

Stack Overflow用户

提问于 2010-12-23 03:44:36

回答 3查看 2.1K关注 0票数 3

我有一个将键(字符串)映射到对象的大字典。我翻了一遍这本大字典，在某些时候，我只想从中抽出几个词条。这本词典通常有数千个词条。当我使用pickle加载字典时，如下所示：

from cPickle import *
# my dictionary from pickle, containing thousands of entries
mydict = open(load('mypickle.pickle'))
# accessing only handful of entries here
for entry in relevant_entries:
  # find relevant entry
  value = mydict[entry]

我注意到加载整个酸菜可能需要3-4秒，这是我不需要的，因为我稍后只访问字典条目的一个很小的子集(如上所示)。

我怎么才能让它变得更快，只加载字典中的条目呢？

谢谢。

python

pickle

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-12-23 04:01:26

如果你的对象是彼此独立的，你可以使用它们的键作为文件名来单独地对它们进行访问和解锁，在某种反常的情况下，目录是一种将文件名映射到文件的字典。这样，只加载相关条目就很简单了。

基本上，您使用内存字典作为缓存，如果缺少搜索键，则尝试从文件系统加载文件。

我并不是真的说你应该这么做。数据库(ZODB、SQLite等)可能更适合持久存储。

票数 0

Stack Overflow用户

发布于 2010-12-23 03:52:10

Pickle序列化对象(hierachies)，它不是磁盘存储。正如您所看到的，您必须解开整个对象才能使用它--这当然很浪费。使用shelve、dbm或数据库(SQLite)进行磁盘存储。

票数 3

Stack Overflow用户

发布于 2010-12-23 03:51:21

你必须有"Ghost“对象，即只是占位符的对象，并在访问时加载它们自己。这是一个困难的问题，但它已经解决了。您有两个选择。您可以使用ZODB中的持久化库，这对此很有帮助。或者，直接开始使用ZODB；问题就解决了。

http://www.zodb.org/

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/4513059

复制

相似问题

问在Python中使用pickle高效地访问字典中的项目
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Python中使用pickle高效地访问字典中的项目EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在Python中使用pickle高效地访问字典中的项目
EN