首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Vaex读取拼图文件

使用Vaex读取拼图文件
EN

Stack Overflow用户
提问于 2020-11-25 01:28:42
回答 1查看 1.2K关注 0票数 2

我正在尝试使用Vaex从一个Parquet文件中读取一些数据到python中。

这是我使用vaex.open函数得到的输出。

代码语言:javascript
复制
>>> import vaex
>>> trade = vaex.open('trade.parquet')
>>> trade
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 3703, in __repr__
    return self._head_and_tail_table(format='plain')
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 3464, in _head_and_tail_table
    return self._as_table(0, n, N - n, N, format=format)
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 3599, in _as_table
    parts = table_part(i1, i2, parts)
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 3573, in table_part
    df = self[k1:k2]
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 4626, in __getitem__
    df = self.trim()
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 3859, in trim
    df = self if inplace else self.copy()
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 5036, in copy
    df.add_column(name, column, dtype=self._dtypes_override.get(name))
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 6053, in add_column
    super(DataFrameArrays, self).add_column(name, data, dtype=dtype)
  File "/home/userman/.local/lib/python3.6/site-packages/vaex/dataframe.py", line 2942, in add_column
    raise ValueError("array is of length %s, while the length of the DataFrame is %s" % (len(ar), self.length_original()))
ValueError: array is of length 1048576, while the length of the DataFrame is 34421587

数据帧的长度是正确的,但我不明白1048576与什么相关。我找到了一个关于读取hdf5文件的previous answer,但它似乎与我的问题无关。数据最初是从csv文件中读取的,然后使用pyarrow导出到parquet。

谁能详细说明这个问题是什么以及如何解决它?

EN

回答 1

Stack Overflow用户

发布于 2021-02-28 02:56:49

我也有同样的问题,因此,我假设你使用的是vaex 3.x,最好是在一个全新的虚拟环境中尝试最新的alpha 4.0.0a13。

pip install vaex==4.0.0a13

更新

从3月9日起,2021年vaex 4已经发布,并在pypi中标记为默认版本,因此不再需要指定版本。

pip install vaex

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64991754

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档