首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >雪橇如何在精确回忆曲线中选择阈值步骤?

雪橇如何在精确回忆曲线中选择阈值步骤?
EN

Stack Overflow用户
提问于 2019-09-24 09:18:28
回答 1查看 4.2K关注 0票数 13

我训练了一个关于乳腺癌数据集的基本FFNN。对于结果,precision_recall_curve函数给出416个不同阈值的数据点。我的数据包含569个唯一的预测值,据我所了解的精确召回曲线,我可以应用568个不同的阈值,并检查结果的精度和召回。

但我怎样做呢?是否有一种方法来设置使用sklearn测试的阈值数?或者至少解释一下sklearn如何选择这些阈值?

我的意思是417应该足够了,即使对于更大的数据集,我只是好奇它们是如何被选中的。

代码语言:javascript
复制
# necessary packages
from sklearn.datasets import load_breast_cancer
import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout

# load data
sk_data = load_breast_cancer(return_X_y=False)

# safe data in pandas
data = sk_data['data']
target = sk_data['target']
target_names = sk_data['target_names']
feature_names = sk_data['feature_names']
data = pd.DataFrame(data=data, columns=feature_names)

# build ANN
model = Sequential()
model.add(Dense(64, kernel_initializer='random_uniform', input_dim=30, activation='relu'))
model.add(Dropout(0.25))
model.add(Dense(32, kernel_initializer='random_uniform', activation='relu'))
model.add(Dropout(0.25))
model.add(Dense(1, activation='sigmoid'))

# train ANN
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
model.summary()

model.fit(data, target, epochs=50, batch_size=10, validation_split=0.2)

# eval
pred = model.predict(data)

# calculate precision-recall curve
from sklearn.metrics import precision_recall_curve
precision, recall, thresholds = precision_recall_curve(target, pred)

# precision-recall curve and f1
import matplotlib.pyplot as plt

#pyplot.plot([0, 1], [0.5, 0.5], linestyle='--')
plt.plot(recall, precision, marker='.')
# show the plot
plt.show()

len(np.unique(pred)) #569
len(thresholds) # 417
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-09-24 12:23:45

通过读取来源precision_recall_curve确实计算了每个唯一预测概率(此处为pred)的精确性和召回率,但忽略了导致完全召回的所有阈值的输出(除了实现完全召回的第一个阈值之外)。

票数 14
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58076966

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档