要点¶

Sklearn 把所有机器学习的模式整合统一起来了，学会了一个模式就可以通吃其他不同类型的学习模式。

例如，分类器，

Sklearn 本身就有很多数据库，可以用来练习。以 Iris 的数据为例，这种花有四个属性，花瓣的长宽，茎的长宽，根据这些属性把花分为三类。

我们要用分类器去把四种类型的花分开。

今天用 KNN classifier，就是选择几个临近点，综合它们做个平均来作为预测值。

导入模块¶

创建数据¶

加载 iris 的数据，把属性存在 X，类别标签存在 y：

观察一下数据集，X 有四个属性，y 有 0，1，2 三类：

把数据集分为训练集和测试集，其中 test_size=0.3，即测试集占总数据的 30%：

可以看到分开后的数据集，顺序也被打乱，这样更有利于学习模型：

建立模型－训练－预测¶

定义模块方式 KNeighborsClassifier()，用 fit 来训练 training data，这一步就完成了训练的所有步骤，后面的 knn 就已经是训练好的模型，可以直接用来 predict 测试集的数据，对比用模型预测的值与真实的值，可以看到大概模拟出了数据，但是有误差，是不会完完全全预测正确的。

降低知识传递的门槛

莫烦经常从互联网上学习知识，开源分享的人是我学习的榜样。他们的行为也改变了我对教育的态度: 降低知识传递的门槛。

我组建了微信群，欢迎大家加入，交流经验，提出问题，互相帮持。 扫码后，请一定备注"莫烦"，否则我不会同意你的入群申请。