草庐IT

数据中心化与标准化

笨笨脑袋瓜子 2024-01-13 原文

一、数据中心化与标准化

对具体问题进行统计分析离不开统计指标,统计指标是对分析对象的数量特征进行描述和分析的基本工具。在利用统计指标进行统计分析时,要特别注意统计数据的可比性和综合性问题。

我们都知道,对比分析是统计分析最基本、最常用的方法。首先,它强调可比性,若失去可比性,其分析结果就会出现偏差。例如,我们有5名新生婴儿的体重(斤)资料为:5、6、7、8、9;同时又有5名成年人的体重(斤)资料为:130,131,132,133,134,要求对比分析两组人员体重差异的大小。从数据表面看,两组人员体重的平均差异均是1斤,若由此便得出两组人员体重的差异和程度相同的结论则是不合适的。因为,两组人员的体重水平不在同一等级上,即量纲不同。从外观上看,婴儿的体重相差1斤就比较明显了,而成年人体重相差1斤则基本察觉不到,这时比较两组人员体重上差异的大小,不应该用平均差异,而应该消除其量纲(即体重基本水平)上的不同。用相对数表示为:体重的平均差异值/平均体重,即用1/7和1/132进行比较、分析。这种简单的对比分析的过程,表面上看是指标的选用问题,实际上则是指标数值无量钢化的处理问题。

除上述简单的统计对比分析外,统计分析更多的是针对较复杂的社会经济现象,需要用比较广泛的统计指标,即利用由众多指标构成的统计指标体系进行描述与分析。而利用多指标进行统计分析,往往需要借助于各种各样的统计综合合成方法,如多指标的综合评价、聚类分析、主成分分析、关联分析,等等。为此,需要指标之间具有综合性。此外,当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用,从而使各指标数值可综合性的问题,必要时需要对各指标数值进行无量钢化处理。

无量钢化,也叫数据的标准化、规格化,它是通过简单的数学变换来消除各指标量纲影响的方法。

中心化,又叫零均值化,是指变量减去均值,中心化处理后的数据中心是(0,0),均值为0(图1)。

图1 数据中心化示意图

二、如何进行数据中心化

进行假设模型中调节效应检验前,一个很重要的步骤就是对样本数据进行中心化处理,为了解决这个问题,不妨假设变量A是单维度变量,由三个题项a1,a2,a3构成,现对A的样本数据进行中心化步骤如下:

首先分别计算每一个题项的均值:分析-描述统计-描述-拖入题项-选项-均值

计算得到三个题项的均值分别为3.85,3.54与3.99。

得到每一个题项的均值后,计算中心化值:

转换-计算变量-输入公式(每一个题项减去每一个题项的均值而后除以题项个数)

案例公式:((a1-3.85)+(a2-3.54)+(a3-3.99))/3

由此便可得到中心化后的样本数据。

当然了,当前随着PROCESS插件的应用,已经不需要手动地进行样本数据的中心化处理,具体而言,我们在进行调节效应检验中可以这么处理:

首先打开PROCESS插件:分析-回归-PROCESS

PROCESS默认不进行数据中心化,我们可以自行设置:回归-PROCESS-options,而后在右侧的Mean center for construction of products设置框中,选择“All variables that define products”即可。

参考文献

[1]马立平.统计数据标准化──无量纲化方法──现代统计分析方法的学与用(三)[J].北京统计,2000(03):34-35.

有关数据中心化与标准化的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  3. ruby - 将 spawn() 的标准输出/标准错误重定向到 Ruby 中的字符串 - 2

    我想使用spawn(针对多个并发子进程)在Ruby中执行一个外部进程,并将标准输出或标准错误收集到一个字符串中,其方式类似于使用Python的子进程Popen.communicate()可以完成的操作。我尝试将:out/:err重定向到一个新的StringIO对象,但这会生成一个ArgumentError,并且临时重新定义$stdxxx会混淆子进程的输出。 最佳答案 如果你不喜欢popen,这是我的方法:r,w=IO.pipepid=Process.spawn(command,:out=>w,:err=>[:child,:out])

  4. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  5. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  6. ruby-on-rails - 标准化文件名的字符串,删除重音和特殊字符 - 2

    我正在尝试找到一种方法来规范化字符串以将其作为文件名传递。到目前为止我有这个:my_string.mb_chars.normalize(:kd).gsub(/[^\x00-\x7F]/n,'').downcase.gsub(/[^a-z]/,'_')但第一个问题:-字符。我猜这个方法还有更多问题。我不控制名称,名称字符串可以有重音符、空格和特殊字符。我想删除所有这些,用相应的字母('é'=>'e')替换重音符号,并将其余的替换为'_'字符。名字是这样的:“Prélèvements-常规”“健康证”...我希望它们像一个没有空格/特殊字符的文件名:“prelevements_routin

  7. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

  8. 使用canal同步MySQL数据到ES - 2

    文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co

  9. ruby-on-rails - 创建 ruby​​ 数据库时惰性符号绑定(bind)失败 - 2

    我正在尝试在Rails上安装ruby​​,到目前为止一切都已安装,但是当我尝试使用rakedb:create创建数据库时,我收到一个奇怪的错误:dyld:lazysymbolbindingfailed:Symbolnotfound:_mysql_get_client_infoReferencedfrom:/Library/Ruby/Gems/1.8/gems/mysql2-0.3.11/lib/mysql2/mysql2.bundleExpectedin:flatnamespacedyld:Symbolnotfound:_mysql_get_client_infoReferencedf

  10. STM32读取串口传感器数据(颗粒物传感器,主动上传) - 2

    文章目录1.开发板选择*用到的资源2.串口通信(个人理解)3.代码分析(注释比较详细)1.主函数2.串口1配置3.串口2配置以及中断函数4.注意问题5.源码链接1.开发板选择我用的是STM32F103RCT6的板子,不过代码大概在F103系列的板子上都可以运行,我试过在野火103的霸道板上也可以,主要看一下串口对应的引脚一不一样就行了,不一样的就更改一下。*用到的资源keil5软件这里用到了两个串口资源,采集数据一个,串口通信一个,板子对应引脚如下:串口1,TX:PA9,RX:PA10串口2,TX:PA2,RX:PA32.串口通信(个人理解)我就从串口采集传感器数据这个过程说一下我自己的理解,

随机推荐