文章/答案/技术大牛

发布

社区首页 >问答首页 >是否有Dask Dataframe的“产品”集合？

问是否有Dask Dataframe的“产品”集合？
EN

Stack Overflow用户

提问于 2019-05-02 15:28:15

回答 1查看 111关注 0票数 0

我正在尝试使用Dataframe来聚合一个大型数据集。

我的dd.df看起来是这样的：

seq                                       kegg       evalue
AAAAAAAAPAADAKK                           K02897     0.001
AAAAAAAAPAADAKK                           K02897     0.007
AAAAAAAAPAPAPVAEEGEPIEHLPEITFDDFSKVELRVAR K01874     0.1

我试着用群比：

计算同一个"kegg“连接到每个"seq”的次数
查找连接到每个"seq“的每个"kegg”的"evalue“的乘积。

我尝试使用以下方法使用groupby().agg()：

df.groupby(['seq','kegg']).agg({'kegg':['count'], 
'evalue':['prod']}, split_out=10)

但是，我得到了以下错误：

ValueError: unknown aggregate prod

从文档中可以看出，似乎存在一个prod聚合，但显然这是行不通的。

我对熊猫和达斯克都是新手，所以我相信这是一个简单的解决办法，我只是没有得到。

dataframe

aggregate

pandas-groupby

dask

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-05-18 15:22:44

正如上面的注释中所讨论的，通过安装较新版本的Dask解决了这一问题。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55955728

复制

相似问题

问是否有Dask Dataframe的“产品”集合？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有Dask Dataframe的“产品”集合？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问是否有Dask Dataframe的“产品”集合？
EN