首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >预测模型: Logistic回归模型,流行的分类模型

预测模型: Logistic回归模型,流行的分类模型
EN

Stack Overflow用户
提问于 2020-10-17 08:41:45
回答 1查看 28关注 0票数 0

我在试着根据获胜的一方做一个预测。我选择的列是候选人的政党和候选人在数据集中的投票。我的代码如下:

代码语言:javascript
复制
# Loading and cleaning dataset
df4 = pd.read_csv('Election-Results-2018 - Parlimen_Results_By_Candidate.csv')
df4['Votes for Candidate'] = df4['Votes for Candidate'].str.replace(',','').astype(float)
df4['Total Votes Cast'] = df4['Total Votes Cast'].str.replace(',','').astype(float)
df4['% of total Votes'] = df4['% of total Votes'].str.replace('%','').astype(float)

# Step 1 - import the model 
from sklearn.linear_model import LogisticRegression

# Step 2 - Define your training data
columns = ['Candidate Party', 'Votes for Candidate']

# Step 3 - create training dataset
X = df[columns]
y = df['New Results']*

运行这些代码后,我收到如下错误:-

代码语言:javascript
复制
KeyError: "None of [Index(['Candidate Party', 'Votes for Candidate'], dtype='object')] are in the [columns]"

我是机器学习的初学者,希望得到任何人的帮助和指导。TQ

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-10-17 20:45:28

这是一个简单的错误,您使用了错误的名称df而不是df4,这应该可以工作:

代码语言:javascript
复制
df4 = pd.read_csv('Election-Results-2018 - Parlimen_Results_By_Candidate.csv')
df4['Votes for Candidate'] = df4['Votes for Candidate'].str.replace(',','').astype(float)
df4['Total Votes Cast'] = df4['Total Votes Cast'].str.replace(',','').astype(float)
df4['% of total Votes'] = df4['% of total Votes'].str.replace('%','').astype(float)

# Step 1 - import the model 
from sklearn.linear_model import LogisticRegression

# Step 2 - Define your training data
columns = ['Candidate Party', 'Votes for Candidate']

# Step 3 - create training dataset
X = df4[columns]
y = df4['New Results']
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64398009

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档