标签 knn 下的文章

kNN算法的实现和运用


kNN就是k-近邻算法,它的工作原理是:存在样本数据集,且样本中每个数据都有标签。在输入没有标签的数据后,将新数据的特征与样本进行比对,可以从样本中提取出最相似数据的标签。一般来说,只选取样本中前K个最相似数据(一般k<20)。最后,选取k个最相似数据中出现最多次的分类,作为新数据的分类。

算法分析 优点:精度高,对异常值不敏感,无输入假定 缺点:空间和计算复杂度高 适用数据:数值型和标称型

Python实现: