草庐IT

Python算法:数的全排列、组合详解

全部标签

基于Matlab的K-近邻算法(KNN)详解(附算法介绍及代码详解)

一、内容提要今天笔者同样以测井岩性分类为实例,为大家分享一种被称为“最简单的机器学习算法之一”的K-近邻算法(K-NearestNeighbor,KNN)。K-近邻算法(KNN,K-NearestNeighbor)可以用于分类和回归[1]。K-近邻算法,意思是每一个样本都可以用它最接近的K个邻居来代表,以大多数邻居的特征代表该样本的特征,据此分类[2]。它的优势非常突出:思路简单、易于理解、易于实现,无需参数估计[3]。本期笔者将KNN算法应用在基于测井数据的岩性分类上。下面分为算法简介、实例计算与代码解读三个部分进行讲解。(代码获取方式详见文末)二、算法简介K-近邻算法K-近邻算法的计算过程

小安利 | 用python优雅地生成author list

当文章增加越来越多作者的时候...一作就是这样被玩废的...‍‍‍‍‍在各种合作/大样本盛行的今天,管理众多作者的信息,不是一个容易的事情。之前就手动制作过20多人的authorlist,添加和修改affiliation的序号时总是很令人抓狂。设想下面这篇文章,要怎么生成投稿或者发给其他作者检查的authorlist?安利一个一直在用的python脚本,可以将保存好的excel信息一键转化成titlepage里的authorlist。省去很多手动操作的时间,也减少可能产生的失误。6个以上作者的文章就可以考虑使用这种方法管理作者信息,用python脚本生成authorlist。这个脚本来自于gi

Javascript 按字母顺序匹配字符串的开头,然后按字母顺序排列包含的文本

我需要帮助整理一些数据。假设我在搜索字段中输入“piz”。我得到所有包含“piz”的条目的返回和数组。我现在想按以下顺序显示它们:pizzapizzeriaapizzettoberpizzo首先是按字母顺序以我输入的内容开头的项目,然后是包含我按字母顺序输入的内容的项目。相反,如果我按字母顺序对它们进行排序,我会得到以下内容apizzettoberpizzopizzapizzeria有人知道怎么做吗?谢谢你的帮助。 最佳答案 您可以将数据分成两个数组,一个以您的输入开头,一个不以您的输入开头。分别排序,然后合并两个结果:vardat

基于密度的聚类算法(1)——DBSCAN详解

基于密度的聚类算法(1)——DBSCAN详解基于密度的聚类算法(2)——OPTICS详解基于密度的聚类算法(3)——DPC详解1.DBSCAN简介DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise,具有噪声的基于密度的聚类方法)是一种典型的基于密度的空间聚类算法。和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN既可以适用于凸样本集,也可以适用于非凸样本集。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。该算法利用基于密度的聚类的概

操作系统——调度算法

文章目录前言一、先来先服务(FCFS)二、最短时间优先(SJF)三、最高响应比优先(HRRN)四、时间片轮转(RR)五、优先级调度六、多级反馈队列总结前言本文的主要内容是调度算法的介绍,包括先来先服务(FCFS)、最短时间优先(SJF)、最高响应比优先(HRRN)、时间片轮转(RR)、优先级调度和多级反馈队列这六种方法,这些调度算法会从其算法思想、算法规则、该方法用于作业调度还是进程调度、进程调度的方式(抢占式和非抢占式)、优缺点以及是否会导致饥饿这几个方面展开介绍,同时在介绍每种调度算法时还会举例子辅助理解。一、先来先服务(FCFS)饥饿是进程或者作业长期得不到服务而产生的一种状态。先来先服

机器学习之支持向量回归(SVR)预测房价—基于python

   大家好,我是带我去滑雪!   本期使用爬取到的有关房价数据集data.csv,使用支持向量回归(SVR)方法预测房价。该数据集中“y1”为响应变量,为房屋总价,而x1-x9为特征变量,依次表示房屋的卧室数量、客厅数量、面积、装修情况、有无电梯、、房屋所在楼层位置、有无地铁、关注度、看房次数共计9项。数据集data.csv可在文末获取。  (ps,往期出过一个利用SVR预测房价,但代码没有分开讲,许多童鞋复制代码运行,总会出现各种问题,所以应童鞋要求,出一篇更为仔细的博客,大部分博主讲解SVR都采用python自带波士顿房价数据集,但很多童鞋大多都需要用到自己的数据集进行SVR建模,我想这

机器学习-常用回归算法归纳(全网之最)

文章目录前言一元线性回归多元线性回归局部加权线性回归多项式回归Lasso回归&Ridge回归Lasso回归Ridge回归岭回归和lasso回归的区别L1正则&L2正则弹性网络回归贝叶斯岭回归Huber回归KNNSVMSVM最大间隔支持向量&支持向量平面寻找最大间隔SVRCART树随机森林GBDTboosting思想AdaBoost思想提升树&梯度提升GBDT面试题整理XGBOOST面试题整理LightGBMXGBoost的缺点LightGBM的优化基于Histogram的决策树算法带深度限制的Leaf-wise算法单边梯度采样算法互斥特征捆绑算法直接支持类别特征支持高效并行Cache命中率优化

Python 微信自动化工具开发系列01_自动获取微信聊天信息(2023年1月可用)

前言一个需求需要利用Python+第三方库wxauto用于微信上自动获取聊天信息,从而根据自己需求对信息自动进行二次处理,比如自动回复,再比如自动发送文件或者其他。这边使用Python的第三方库`wxauto`来进行开发,而不是`itchat` ---记录于2022年07月 ---2023年1月再次测试可用使用Python3的第三方库wxauto,它适用于Windows的微信客户端官网:https://github.com/cluic/wxauto原因这边使用wxauto来进行开发,而不是itchat,原因如下itchat都是之前的教

Python生成allure测试报告,allure使用详细说明

pytest框架自带一个测试报告,内容也相对全面,但是可读性差点,allure生成的测试报告,可改造性强,看起来也美观。使用过程在此总结一下。一、生成allure测试报告1.下载安装allure-pytest插件,我一般都是在pycharm里直接安装:File--Setting--Project--PythonInterpreter--右侧"+"--输入"allure-pytest"--选中--点击左下角"InstallPackage"。有问题是环境配置的问题的话,可以百度下。2.应该是需要在项目的根目录建一个report文件夹,这点不确定了,可以试下,不手动report文件夹,可以生成报告吗

典型相关分析(Canonical Correlation Analysis,CCA)原理及Python、MATLAB实现

随着对CCA的深入研究,是时候对CCA进行一下总结了。本菜鸡主要研究方向为故障诊断,故会带着从应用角度进行理解。典型相关分析基本原理从字面意义上理解CCA,我们可以知道,简单说来就是对不同变量之间做相关分析。较为专业的说就是,一种度量两组变量之间相关程度的多元统计方法。关于相似性度量距离问题,在这里有一篇Blog可以参考参考。首先,从基本的入手。当我们需要对两个变量X,YX,YX,Y进行相关关系分析时,则常常会用到相关系数来反映。学过概率统计的小伙伴应该都知道的吧。还是解释一下。相关系数:是一种用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差