草庐IT

数据仓库与数据挖掘——Apriori算法

一、基本介绍        Apriori算法是经典的挖掘频繁项目集和关联规则的数据挖掘算法。当定义问题时,通常会使用先验知识或者假设,这被称作"一个先验"。算法使用频繁项目集的先验性质,即频繁项目集的所有非空子集也一定是频繁的。Apriori算法使用一种称为逐层搜索的迭代方法,其中k项集用于探索(k+1)项集。首先通过扫描数据库,累计每个项的计数,并收集满足最小支持度的项,找出频繁1项集的集合。该集合记为L1。然后,使用L1找出频繁2项集的集合L2,使用L2找出L3……如此下去,直到不能再找到频繁k项集。每找出一个Lk需要一次数据库的完整扫描。Apriori算法利用频繁项目集的先验性质来压缩

实战SRC漏洞挖掘全过程,流程详细【网络安全】

前言记录一次完整的某SRC漏洞挖掘实战,为期一个多星期。文章有点长,请耐心看完,记录了完整的SRC漏洞挖掘实战渗透过程因为选择的幸运儿没有对测试范围进行规划,所以此次范围就是没有范围。先上主域名看一眼,看看能收集到什么有效信息:发现存在搜索框:测试点+1对页面点点点没发现什么有用的页面。抓包看看,发现网站搭建了CDN,还有特殊文件:难度+1,信息+1谷歌一下,Sitecore是CMS,如果能确定这个CMS的版本就变成了白盒审计,但是尝试了一下无法确定版本只能用网上公开的CMS漏洞来测试。《黑客&网络安全入门&进阶学习资源包》免费分享网上只找到一个CVE-2021-42237(SitecoreX

面向人群属性关系挖掘的数据可视化———基于美国人口adult数据集

目录面向人群属性关系挖掘的数据可视化一、课程设计内容及目的二、总体设计(一)题目需求分析(二)系统整体流程图或组成框图三、详细设计(一)读取数据并导入需要的第三方库(二)通过判断每个属性的取值范围来估计属性及其类型(三)除去数据值前的空格,调整数据格式,并处理缺失数据四、数据可视化展示及分析(二)职业情况(Occupation)与收入情况(income)关系可视化及分析(三)工作时长(hours-per-week)与收入情况(income)关系可视化及分析(四)职业情况(Occupation)与性别(gender)关系可视化及分析五、心得体会面向人群属性关系挖掘的数据可视化一、课程设计内容及目

数据挖掘-基本概念

集成学习概念,多个弱一个强数据抽样不同点bagging:放回采样、原实际、且独立boosting:训练集不变、样例权重变化,权重根据上一轮结果调整(每个样例一个权重、自动调整)随机森林:从N样本随机选择n样本,使用bootstrap有放回的GBTD:回归树,低偏移高方差GBTD和xaboost区别:GBTD=cart、一阶XGBoost=线性、一二阶XGBOOST、正则、并行排序、分裂、多线程聚类算法优:特殊分布、噪快簇大、领域参数缺:密度消耗灾难场景:凸快效噪任意与kemeans区别噪声不敏感-》离群点偏差-》少数据不会改进-》中心点-》复杂度o(n)模型评估查准:tptpfp,precis

深入理解机器学习——关联规则挖掘:基础知识

分类目录:《深入理解机器学习》总目录许多商业企业在日复一日的运营中积聚了大量的数据。例如,食品商店的收银台每天都收集大量的顾客购物数据。下图给出一个这种数据的例子,通常称作购物篮事务(MarketBasketTransaction)。表中每一行对应一个事务,包含一个唯一标识TID和给定顾客购买的商品的集合。零售商对分析这些数据很感兴趣,以便了解他们的顾客的购买行为。可以使用这种有价值的信息来支持各种商务应用,如市场促销,库存管理和顾客关系管理等。关联规则挖掘系列文章主要是介绍一种称作关联分析(AssociationAnalysis)的方法,用于发现隐藏在大型数据集中的有意义的联系。所发现的联系

Apriori关联规则挖掘算法函数

假设有以下《超市商品购买.txt》数据集,每行代表一个顾客在超市的购买记录:I1:西红柿、排骨、鸡蛋、毛巾、水果刀I2:西红柿、茄子、水果刀、香蕉I3:鸡蛋、袜子、毛巾、肥皂、水果刀I4:西红柿、排骨、茄子、毛巾、水果刀I5:西红柿、排骨、酸奶I6:鸡蛋、茄子、酸奶、肥皂、香蕉I7:排骨、鸡蛋、茄子、水果刀I8:土豆、鸡蛋、袜子、香蕉、水果刀I9:西红柿、排骨、鞋子、土豆、香蕉建一个Python脚本,命名为“学号+姓名+test4.py”,完成以下任务:1)将以上购买记录转换为布尔类型数据,其数据结构为DataFrame。(10分)2)利用Apriori关联规则挖掘算法函数进行关联规则挖掘,最

漏洞挖掘-不安全的HTTP方法

前言:年关将至,这可能是年前最后一篇文章了。已经有一段时间没有更新文章了,因为最近也没有学到什么新的知识,也就没什么可写的,又不想灌水。最近关注的好兄弟们多了很多,在这里也是十分感谢大家的支持,在未来笔者也会在法律允许的范围内一如既往的为大家分享比较有用的知识,也会一如既往的不在文章里插广告恶心人。今天的这篇文章是笔者最近做漏洞挖掘的时候,无意中捡到的漏洞,这个漏洞就是典型的--服务器开启了不安全的HTTP方法,导致服务器易受攻击。那么究竟什么才是HTTP方法,他们有哪些危害,我们在平时测试的时候应该如何去测试呢?0X01HTTP方法有哪些不安全的HTTP方法是指在不使用安全连接(例如TLS)

内网渗透-src挖掘-外网打点到内网渗透-3层内网渗透测试记录-2023年1月

1、通过信息搜集,发现目标有一个外网访问的通达OA系统2、通达OA的漏洞是非常多的,这里利用大佬写好的通达OA一键getshell工具成功获取webshell3、连接webshell,上传cs马儿到服务器4、执行获取主机权限成功上线5、通过Ladon插件发现系统有2张网卡,有一个内网ip,10.0.20.986、因为目标是win7系统,可以直接抓取明文密码7、使用ladon插件开启目标3389桌面使用socket代理使用proxifier代理软件,成功连接入目标内网8、使用抓取到的远程登陆目标服务器上传fscan到目标服务器,扫描内网网段,发现内网中有一台服务器有redis未授权访问漏洞9、因

河北工业大学数据挖掘实验一 数据预处理

河北工业大学数据挖掘实验一数据预处理一、实验目的二、实验原理1、数据预处理2、数据清理3、数据集成4、数据变换5、数据归约三、实验内容和步骤1、实验内容2、实验步骤3、程序框图4、实验样本5、实验代码四、实验结果五、实验分析一、实验目的(1)熟悉完全数据立方体构建、联机分析处理算法。(2)浏览拟被处理的的数据,发现各维属性可能的噪声、缺失值、不一致性等,针对存在的问题拟出采用的数据清理、数据变换、数据集成的具体算法。(3)编写程序,实现数据清理、数据变换、数据集成等功能。(4)调试整个程序获得清洁的、一致的、集成的数据,选择适于全局优化的参数。(5)写出实验报告。二、实验原理1、数据预处理现实

【数据挖掘大作业】基于决策树的评教指标筛选(weka+数据+报告+操作步骤)

数据挖掘大作业下载链接:【数据挖掘大作业】基于决策树的评教指标筛选(weka使用手册+数据+实验报告)一、考核内容现有某高校评教数据(pjsj.xls),共计842门课程,属性包括:课程名称、评价人数、总平均分以及10个评价指标Index1-Index10。指标内容详见表1。表1学生评教指标体系及权重序号指     标权重(10%)Index1老师在第一节课能向我们介绍本课程的基本情况:课程在专业学习中的地位作用、课程性质(必修课还是选修课)、授课计划、考核性质和方式(考试课还是考查课、闭卷还是开卷等),本课程教学中课外作业、测验、期中与期末考试及实验(针对有实验的课程)等环节的评分比例。10