首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >停止patsy dmatrix删除NaN行

停止patsy dmatrix删除NaN行
EN

Stack Overflow用户
提问于 2018-08-01 18:30:50
回答 1查看 775关注 0票数 1

我想使用patsy的dmatrix函数来生成一个设计矩阵,其中保留了带有NaN值的行。例如,下面的代码将返回一个四行的设计矩阵,这是我们通常需要的。但是,在本例中,我希望dmatrix返回一个有五行的矩阵,其中第一行将包含一个NaN值。

代码语言:javascript
复制
import numpy as np
import pandas as pd
from patsy import dmatrix

df = pd.DataFrame({'x1': np.arange(5), 'x2': np.arange(5)})
dmatrix("~x1+x2.diff()", df)

或者,我将满足于一个允许我检索被删除/保留的行号的答案。在上面的示例中,第1行是被删除的行,而行2-5则保留。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-01 19:43:52

尝试:

(.,NA_action=patsy.NAAction(NA_types=[]))

这告诉patsy不要将NaN看作是一个缺失的值,因此它将被传递。文档在这里:https://patsy.readthedocs.io/en/latest/API-reference.html#missing-values

或者,我将满足于一个允许我检索被删除/保留的行号的答案。

如果您使用return_type="dataframe",那么patsy将返回包含您的设计矩阵的熊猫DataFrame,该DataFrame上的索引将对应于原始输入中的行,因此您可以看到哪些行被保留或删除。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51640071

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档