首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有Dask Dataframe的“产品”集合?

是否有Dask Dataframe的“产品”集合?
EN

Stack Overflow用户
提问于 2019-05-02 15:28:15
回答 1查看 111关注 0票数 0

我正在尝试使用Dataframe来聚合一个大型数据集。

我的dd.df看起来是这样的:

代码语言:javascript
复制
seq                                       kegg       evalue
AAAAAAAAPAADAKK                           K02897     0.001
AAAAAAAAPAADAKK                           K02897     0.007
AAAAAAAAPAPAPVAEEGEPIEHLPEITFDDFSKVELRVAR K01874     0.1

我试着用群比:

  1. 计算同一个"kegg“连接到每个"seq”的次数
  2. 查找连接到每个"seq“的每个"kegg”的"evalue“的乘积。

我尝试使用以下方法使用groupby().agg()

代码语言:javascript
复制
df.groupby(['seq','kegg']).agg({'kegg':['count'], 
'evalue':['prod']}, split_out=10)

但是,我得到了以下错误:

代码语言:javascript
复制
ValueError: unknown aggregate prod

从文档中可以看出,似乎存在一个prod聚合,但显然这是行不通的。

我对熊猫和达斯克都是新手,所以我相信这是一个简单的解决办法,我只是没有得到。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-18 15:22:44

正如上面的注释中所讨论的,通过安装较新版本的Dask解决了这一问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55955728

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档