我对Python和机器学习还比较陌生,但我一直致力于建立一个抵押贷款价格的预测模型。我挣扎的地方是使用K-最近邻算法来创建一个特性。
以下是我如何理解我想要完成的任务的机制:
我在KNN推测中发现了一些东西,但这似乎不是我要找的。
我该如何执行这个想法呢?是否有我错过的资源会有所帮助?
如有任何指导,将不胜感激。谢谢!
发布于 2017-07-28 05:37:05
所以,据我所知,你想要拟合KNN模型,使用抵押贷款销售数据来预测抵押贷款上市数据的价格。这是一个经典的KNN问题,您需要为列表数据中的每个特征向量在出售的数据中找到最近的特征向量,然后取这些特征向量的中值。
X_train = [X1, X2, ..., Xn]
y_train = [P1, P2, ..., Pn]NUMBER_OF_NEIGHBOURS = 5from sklearn.neighbors import KNeighborsClassifier
knn_model = KNeighborsClassifier(n_neighbors=NUMBER_OF_NEIGHBOURS)
knn_model.fit(X_train, y_train)X_test = [F1, F2, ..., Fm]y_predicted = knn_model.predict(X_test)y_predicted = [(P11, P12, .., P15), (P21, P22, .., P25), .., (Pm1, Pm2, .., Pm5)]import numpy as np
Zj = np.median(np.array([Pj1, Pj2, .., Pj5]))参考资料:http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html
https://stackoverflow.com/questions/45362482
复制相似问题