草庐IT

9. k-近邻的k的影响有多大?

坛城守护者 2023-09-21 原文

k-近邻涉及到的参数不多,也容易玩,因此我们来看下最为关键的参数k,对结果的影响。

之前我们都是把结果设置成了3,如数字识别,3的结果是1.06%的错误率。

我们来看看其他的:

1:最靠近哪个就是哪个,1.37%的错误率,也很不错嘛!看来你和闺蜜/兄弟的性格很接近啊。

2:1.37%,也挺好;

5:1.79%,开始下滑了;

10:2%        20:2.75%        50:5.18%        100:7.18%

至此可以看出,k大到一定程度(在这个数据集里,5就开始有点下滑了),结果就会变差。所以,k并非是越大越好。你可能要多次跑数据后,才能找到最合适的值。像这个数据集里,3这样小的数字,反而是最佳的设置。


如上是手写数字识别的数据集,我们来看看之前约会的数据集(90%的数据)。

3:8.11%,有点差,但用在约会判断上也还可以了;

1:9.6%,一票否决,也还好,能接受;

5:7.67%,看,比3还好,所以对于不同的数据集,并不是3是最好的;

7:7.78%,也差不多;

11:9.33%,变差了;

21:12.89%,又差了;后面就不测了;

所以呢,对于约会数据集,5-7是最佳的(我试了下6,和5的结果是一样的)。


由两个数据集的测试可得:

1)k不是越大越好,但至少要达到3;

2)要经过实测,确定最佳的k,而3可以作为初始值(不要认为3就一定是最佳值);

好了,这篇比较简短。但是观点是比较明确的。希望大家喜欢。

有关9. k-近邻的k的影响有多大?的更多相关文章

  1. ruby-on-rails - 添加回形针新样式不影响旧上传的图像 - 2

    我有带有Logo图像的公司模型has_attached_file:logo我用他们的Logo创建了许多公司。现在,我需要添加新样式has_attached_file:logo,:styles=>{:small=>"30x15>",:medium=>"155x85>"}我是否应该重新上传所有旧数据以重新生成新样式?我不这么认为……或者有什么rake任务可以重新生成样式吗? 最佳答案 参见Thumbnail-Generation.如果rake任务不适合你,你应该能够在控制台中使用一个片段来调用重新处理!关于相关公司

  2. .net - .NET 将如何影响 Python 和 Ruby 应用程序? - 2

    我很好奇.NET将如何影响Python和Ruby应用程序。用IronPython/IronRuby编写的应用程序是否会非常特定于.NET环境,以至于它们实际上将变得特定于平台?如果他们不使用任何.NET功能,那么IronPython/IronRuby相对于非.NET同类产品的优势是什么? 最佳答案 我不能说任何关于IronRuby的东西,但是大多数Python实现(如IronPython、Jython和PyPy)都试图尽可能忠实于CPython实现。不过,IronPython正在迅速成为这方面的佼佼者之一,并且在PlanetPyth

  3. 未来的趋势————以ChatGPT为标杆的AI对生活的影响是巨大的 - 2

    文章目录前言1.AI的发展历程2.我是如何接触到人工智能的概念和产品的3.对于ChatGPT的一点看法4.AI对大学毕业生的职业发展的利与弊5.对于AI的思考和问题前言随着ChatGPT的爆火,生成式AI,大模型的人工智能被越来越多的人注意到,同时他也带来了许多问题。本文将对几方面进行探讨。1.AI的发展历程远古时期在公元前第一个千禧年,中国,印度和希腊哲学家都提出了一些推理的研究理论,比如亚里士多德(Aristotle)进行了演绎推理三段论的完整分析,欧几里得(Euclid)所著Elements是一种形式推理的模型,MuḥammadibnMūsāal-Khwārizmī,发明了代数学,即我们

  4. ruby - 作为开发人员,不同的 Ruby 线程模型(Ruby 与 JRuby)对您的代码有什么实际影响? - 2

    我试图了解MRIRuby1.8和JRuby之间不同线程模型的实际影响。作为开发者,这种差异对我意味着什么?另外,MRIRuby1.8中是否有任何实际代码示例会由于不同的线程模型而在JRuby上具有更差的性能特征? 最佳答案 状态ruby1.8有绿色线程,这些线程可以快速创建/删除(作为对象)但不是真正的并行执行,甚至不由操作系统调度,而是由虚拟机调度ruby1.9有真正的线程,由于操作系统调用,创建/删除(作为对象)很慢,但由于GIL(全局解释器锁)一次只允许一个线程执行,所以这些都不是真正的线程并行JRuby也有操作系统调度的真实

  5. 又是DNA甲基化,孕期母亲的压力会影响儿童健康 - 2

    产前母亲的生活压力事件与后代神经发育不良相关联。研究人员表示,关联的生物学机制大部分是未知的,但在体内发生的一种化学反应——DNA甲基化,即一个小分子甲基被添加到DNA上——可能起着一定作用。这些发现可为了解胎儿环境如何可能影响神经发育、代谢和免疫功能提供新发现。辛辛那提大学的一项新研究探索了怀孕期间母亲的压力对婴儿神经发育的影响。该研究分析了12个独立队列超过5,500名参与者的相关数据。“我们的研究是第一个利用如此大规模样本量分析整个表观基因组的,我们不只关注压力相关基因,还探索了所有可研究的表观基因组位点,”辛辛那提大学医学院环境和公共卫生科学系的AnnaRuehlmann博士说。该研究

  6. Ruby:C类包含模块M;在 M 中包含模块 N 不会影响 C。什么给了? - 2

    更详细地说,我有一个模块Narf,它为一系列类提供基本功能。具体来说,我想影响所有继承Enumerable的类。所以我在Enumerable中includeNarf。Array是默认包含Enumerable的类。然而,它不受Narf延迟包含在模块中的影响。有趣的是,在包含之后定义的类从Enumerable获取Narf。示例:#ThismoduleprovidesessentialfeaturesmoduleNarfdefnarf?puts"(from#{self.class})ZORT!"endend#IwantallEnumerablestobeabletoNarfmoduleEnu

  7. ruby - 为什么括号会影响哈希值? - 2

    当我使用respond_with并传递文字哈希时,它给了我错误:syntaxerror,unexpectedtASSOC,expecting'}'`respond_with{:status=>"Notfound"}`但是,当我像这样将文字散列括在括号中时:respond_with({:status=>"Notfound"})函数运行顺利。为什么括号会有所不同?哈希不是封闭调用吗? 最佳答案 调用方法时,方法名后面的左大括号被解释为block的开始。这优先于作为散列的解释。规避此问题的一种方法是使用括号将解释强制执行为方法参数。例如,

  8. ruby-on-rails - 登录 Rails,是否会影响性能? - 2

    Rails在标准库中与Ruby的logger类捆绑在一起。可用的日志级别是::debug、:info、:warn、:error和:致命的。我想知道如果我在我的Rails应用程序中添加大量日志记录并将日志级别设置为:debug用于开发和测试,在生产中运行时关闭日志记录或设置在更高级别,例如config.log_level=:fatal? 最佳答案 简短的回答是,日志记录总是会对性能产生影响,尤其是在记录到磁盘时。但是,有一些微妙之处。首先,使用:debug级别将比:fatal有更大的性能损失,因为正在评估和写入日志输出的字符串数量要多

  9. ruby - 使用空格而不是制表符进行缩进的性能影响 - 2

    我目前使用软制表符(即空格)来缩进我的Ruby代码,如果我使用硬制表符会在解释代码时提高性能吗?我假设读取一个制表符比解析4个空格字符更快(但可以忽略不计)。 最佳答案 您是否了解源代码解释所涉及的所有阶段?只有第一个,词法分析,必须处理空白,在空白的情况下,“处理”意味着“忽略它”。这个阶段只占总时间的一小部分,它通常使用正则表达式完成并且几乎具有线性复杂度。将其与解析进行对比,比较起来可能需要很长时间。解释只是在某种程度上可行,因为这两个阶段(加上第三个阶段,字节码生成,在使用字节码的实现中)比重要程序的实际执行要少得多。这个不

  10. ruby: block 可以影响方法中的局部变量吗? - 2

    我只是在学习ruby​​并试图理解block中执行的代码的范围。例如,我希望能够创建一个block来影响它附加到的方法,如下所示:deftest(&block)block.call()ifblock_given?puts"intest,foois#{foo}"puts"intest,baris#{bar}"endtest(){foo="thisisfoo"bar="thisisbar"}在这种情况下,我根本不想修改block——我希望能够使用简单的变量引用而不使用参数来编写它。只有修改上面例子中的'test'方法,才能访问block中定义的变量吗?同样,目标是不修改block,但能够在

随机推荐