草庐IT

挖掘法

全部标签

面向人群属性关系挖掘的数据可视化———基于美国人口adult数据集

目录面向人群属性关系挖掘的数据可视化一、课程设计内容及目的二、总体设计(一)题目需求分析(二)系统整体流程图或组成框图三、详细设计(一)读取数据并导入需要的第三方库(二)通过判断每个属性的取值范围来估计属性及其类型(三)除去数据值前的空格,调整数据格式,并处理缺失数据四、数据可视化展示及分析(二)职业情况(Occupation)与收入情况(income)关系可视化及分析(三)工作时长(hours-per-week)与收入情况(income)关系可视化及分析(四)职业情况(Occupation)与性别(gender)关系可视化及分析五、心得体会面向人群属性关系挖掘的数据可视化一、课程设计内容及目

数据挖掘-基本概念

集成学习概念,多个弱一个强数据抽样不同点bagging:放回采样、原实际、且独立boosting:训练集不变、样例权重变化,权重根据上一轮结果调整(每个样例一个权重、自动调整)随机森林:从N样本随机选择n样本,使用bootstrap有放回的GBTD:回归树,低偏移高方差GBTD和xaboost区别:GBTD=cart、一阶XGBoost=线性、一二阶XGBOOST、正则、并行排序、分裂、多线程聚类算法优:特殊分布、噪快簇大、领域参数缺:密度消耗灾难场景:凸快效噪任意与kemeans区别噪声不敏感-》离群点偏差-》少数据不会改进-》中心点-》复杂度o(n)模型评估查准:tptpfp,precis

深入理解机器学习——关联规则挖掘:基础知识

分类目录:《深入理解机器学习》总目录许多商业企业在日复一日的运营中积聚了大量的数据。例如,食品商店的收银台每天都收集大量的顾客购物数据。下图给出一个这种数据的例子,通常称作购物篮事务(MarketBasketTransaction)。表中每一行对应一个事务,包含一个唯一标识TID和给定顾客购买的商品的集合。零售商对分析这些数据很感兴趣,以便了解他们的顾客的购买行为。可以使用这种有价值的信息来支持各种商务应用,如市场促销,库存管理和顾客关系管理等。关联规则挖掘系列文章主要是介绍一种称作关联分析(AssociationAnalysis)的方法,用于发现隐藏在大型数据集中的有意义的联系。所发现的联系

Apriori关联规则挖掘算法函数

假设有以下《超市商品购买.txt》数据集,每行代表一个顾客在超市的购买记录:I1:西红柿、排骨、鸡蛋、毛巾、水果刀I2:西红柿、茄子、水果刀、香蕉I3:鸡蛋、袜子、毛巾、肥皂、水果刀I4:西红柿、排骨、茄子、毛巾、水果刀I5:西红柿、排骨、酸奶I6:鸡蛋、茄子、酸奶、肥皂、香蕉I7:排骨、鸡蛋、茄子、水果刀I8:土豆、鸡蛋、袜子、香蕉、水果刀I9:西红柿、排骨、鞋子、土豆、香蕉建一个Python脚本,命名为“学号+姓名+test4.py”,完成以下任务:1)将以上购买记录转换为布尔类型数据,其数据结构为DataFrame。(10分)2)利用Apriori关联规则挖掘算法函数进行关联规则挖掘,最

漏洞挖掘-不安全的HTTP方法

前言:年关将至,这可能是年前最后一篇文章了。已经有一段时间没有更新文章了,因为最近也没有学到什么新的知识,也就没什么可写的,又不想灌水。最近关注的好兄弟们多了很多,在这里也是十分感谢大家的支持,在未来笔者也会在法律允许的范围内一如既往的为大家分享比较有用的知识,也会一如既往的不在文章里插广告恶心人。今天的这篇文章是笔者最近做漏洞挖掘的时候,无意中捡到的漏洞,这个漏洞就是典型的--服务器开启了不安全的HTTP方法,导致服务器易受攻击。那么究竟什么才是HTTP方法,他们有哪些危害,我们在平时测试的时候应该如何去测试呢?0X01HTTP方法有哪些不安全的HTTP方法是指在不使用安全连接(例如TLS)

内网渗透-src挖掘-外网打点到内网渗透-3层内网渗透测试记录-2023年1月

1、通过信息搜集,发现目标有一个外网访问的通达OA系统2、通达OA的漏洞是非常多的,这里利用大佬写好的通达OA一键getshell工具成功获取webshell3、连接webshell,上传cs马儿到服务器4、执行获取主机权限成功上线5、通过Ladon插件发现系统有2张网卡,有一个内网ip,10.0.20.986、因为目标是win7系统,可以直接抓取明文密码7、使用ladon插件开启目标3389桌面使用socket代理使用proxifier代理软件,成功连接入目标内网8、使用抓取到的远程登陆目标服务器上传fscan到目标服务器,扫描内网网段,发现内网中有一台服务器有redis未授权访问漏洞9、因

河北工业大学数据挖掘实验一 数据预处理

河北工业大学数据挖掘实验一数据预处理一、实验目的二、实验原理1、数据预处理2、数据清理3、数据集成4、数据变换5、数据归约三、实验内容和步骤1、实验内容2、实验步骤3、程序框图4、实验样本5、实验代码四、实验结果五、实验分析一、实验目的(1)熟悉完全数据立方体构建、联机分析处理算法。(2)浏览拟被处理的的数据,发现各维属性可能的噪声、缺失值、不一致性等,针对存在的问题拟出采用的数据清理、数据变换、数据集成的具体算法。(3)编写程序,实现数据清理、数据变换、数据集成等功能。(4)调试整个程序获得清洁的、一致的、集成的数据,选择适于全局优化的参数。(5)写出实验报告。二、实验原理1、数据预处理现实

【数据挖掘大作业】基于决策树的评教指标筛选(weka+数据+报告+操作步骤)

数据挖掘大作业下载链接:【数据挖掘大作业】基于决策树的评教指标筛选(weka使用手册+数据+实验报告)一、考核内容现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。指标内容详见表1。表1学生评教指标体系及权重序号指     标权重(10%)Index1老师在第一节课能向我们介绍本课程的基本情况:课程在专业学习中的地位作用、课程性质(必修课还是选修课)、授课计划、考核性质和方式(考试课还是考查课、闭卷还是开卷等),本课程教学中课外作业、测验、期中与期末考试及实验(针对有实验的课程)等环节的评分比例。10

【数据挖掘】决策树归纳中ID3算法讲解及构建决策树实战(图文解释 超详细)

需要完整PPT请点赞关注收藏后评论区留言私信~~~1:分类概述分类是一种重要的数据分析形式。数据分类也称为监督学习,包括学习阶段(构建分类模型)和分类阶段(使用模型预测给定数据的类标号)两个阶段。数据分类方法主要有决策树归纳、贝叶斯分类、K-近邻分类、支持向量机SVM等方法 2:决策树规约决策树属于经典的十大数据挖掘算法之一,是一种类似于流程图的树型结构,其规则就是if…then…的思想,用于数值型因变量的预测和离散型因变量的分类。决策树算法简单直观,容易解释,而且在实际应用中具有其他算法难以比肩的速度优势决策树方法在分类、预测和规则提取等领域有广泛应用。在20世纪70年代后期和80年代初期,

【数据挖掘】决策树归纳中ID3算法讲解及构建决策树实战(图文解释 超详细)

需要完整PPT请点赞关注收藏后评论区留言私信~~~1:分类概述分类是一种重要的数据分析形式。数据分类也称为监督学习,包括学习阶段(构建分类模型)和分类阶段(使用模型预测给定数据的类标号)两个阶段。数据分类方法主要有决策树归纳、贝叶斯分类、K-近邻分类、支持向量机SVM等方法 2:决策树规约决策树属于经典的十大数据挖掘算法之一,是一种类似于流程图的树型结构,其规则就是if…then…的思想,用于数值型因变量的预测和离散型因变量的分类。决策树算法简单直观,容易解释,而且在实际应用中具有其他算法难以比肩的速度优势决策树方法在分类、预测和规则提取等领域有广泛应用。在20世纪70年代后期和80年代初期,