我有一个来自等离子DataStore的RecordBatch,我可以将它读入pyarrow.RecordBatch或pyarrow.Table。有没有办法在pyarrow.Table上使用新的Dataset API (可以在ParquetDataset上使用)中的filter方法?这将允许我使用这样的过滤器:看一下源代码,pyarrow.Table和pyarrow.RecordBa
我正在尝试使用pyarrow in with pyspark。然而,当我尝试执行我收到以下错误-----------------------------------------~/opt/anaconda3/lib/python3.7/site-packages/pyarrow/__init__.py in <module>
47 import
当我尝试在python中导入pyarrow时,我得到了以下错误:File "/services/matejm/anaconda3/lib/python3.7/site-packages/pyarrow/_init_.py", line 49, in <module>
from pyarrow.lib import