这个例子直接取自这里的文档:https://docs.dask.org/en/latest/bag-api.html#dask.bag.Bag.take
from dask.bag import from_sequence
b = from_sequence(range(10))
b.take(3)它应该打印出来
(0,1,2)但对我来说是印出来的
(0,)这是dask 2.20.0和python3.8的版本。
b.compute()如您所期望的那样打印[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]。我只是在学习达斯克,take(3)的这种行为似乎很奇怪。
发布于 2020-07-13 22:48:14
在我看来,文档有一些问题。根据这些文档,“如果第一个k中有少于npartitions的行,将引发警告并返回任何已找到的行”,但在本例中不返回警告。
from dask.bag import from_sequence
b = from_sequence(range(10))如果您print(b),它会返回
dask.bag<from_se..., npartitions=10>因此,这里有10个分区,根据docs,b.take(3)应该返回(0,)并发出警告。如果您将包重新划分为b = b.repartition(2),那么b.take(3)将返回(0, 1, 2)。
正如我所说的,更新是文档中的一个问题。这是固定的这里。
https://stackoverflow.com/questions/62885311
复制相似问题