你能简要描述一下下面这几行代码是什么意思吗?这是Python中逻辑回归的代码。
size =0.25和random_state =0是什么意思?什么是train_test_split?在这行代码中做了什么?
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)在这些代码行中做了什么?
logistic_regression= LogisticRegression()
logistic_regression.fit(X_train,y_train)
y_pred=logistic_regression.predict(X_test) 发布于 2019-11-27 15:58:23
在这里看看the description of the function:
random_state为随机数生成器设置种子,使您在每次运行时都获得相同的结果,这在教育设置中特别有用,可以为每个人提供相同的result.test_size指的是测试拆分中使用的比例,这里75%的数据用于训练,25%用于测试模型。其他行只是在训练数据集上运行逻辑回归。然后使用测试数据集来检查拟合回归的好坏。
发布于 2019-11-27 15:58:52
=0.25和random_state =0是什么意思?
test_size=0.25 -> 25%的训练和测试数据拆分。
random_state = 0 ->对于可重现的结果,该值可以是任何数字。
在这行代码中做了什么?
将X和y拆分为X_train, X_test, y_train, y_test
以及在这些代码行中做了什么?
通过fit(X_train, y_train)训练逻辑回归模型,然后在测试集X_test上进行预测。
稍后,您可能会将y_pred与y_test进行比较,以了解模型的准确性。
发布于 2019-11-27 16:09:41
这一行:
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)将源代码分为训练集和测试集,0.25表示25%的源代码将用于测试,其余的将用于训练。
对于random_state = 0,这里是一个brief discussion。以上链接中的一部分:
如果使用random_state=some_number,则可以保证Run 1的输出将等于Run 2的输出。
logistic_regression= LogisticRegression() #Creates logistic regressor计算源的一些值。Recommended read
logistic_regression.fit(X_train,y_train) 以上链接中的一部分:
这里的拟合方法,当应用于训练数据集时,学习模型参数(例如,均值和标准差) ...实际的random_state数是42,0,21,...重要的是,每次你使用42,你都会在第一次拆分时得到相同的输出。如果您想要可重现的结果,这是很有用的。
基于训练集的学习对测试集进行预测。
y_pred=logistic_regression.predict(X_test) https://stackoverflow.com/questions/59065481
复制相似问题