《Scikit-learn机器学习》 第4章 k-近邻算法 小结

K-近邻“分类”算法基本语法


from sklearn.neighbors import KNeighborsClassifier, RadiusNeighborsClassifier
clf = KNeighborsClassifier(n_neighbors, weights) ## n_neighbors:最近邻样本的个数, weights的默认值为'uniform',此外可取'distance', 表示距离权重法。
clf2 = RadiusNeighborsClassifier(n_neighbors, radius) ## 训练出的模型在预测未知标签样本时,由以样本为球心,radius为半径的球内的样本投票决定。
clf.fit(X, y)
y_sample = clf.predict(X_sample)
clf.kneighbors(X_sample, return_distance = True) ## return_distance=True函数返回一个二元元组,第一个元素为与X_sample距离最近的k个点到X_sample的距离,第二个为与X_sample距离最近的k个点的索引。若return_distance=False,则只返回与X_sample距离最近的k个点的索引。

K-近邻“回归”算法基本语法


from sklearn.neighbors import KNeighborsRegressor
knn = KNeighborsRegressor(k) ## k: 最近邻的个数
knn.fit(X, y)
y_test_pred = knn.predict(X_test)
knn.score(X_test, y_test) ## 返回在测试集上的得分,对于回归问题,得分为“拟合优度”

猜你喜欢

转载自blog.csdn.net/sunjianqiang12345/article/details/81270165
今日推荐