草庐IT

大数据与云计算

m0_66241973 2023-07-18 原文

1.1大数据

  1. 大数据的定义:在一定时间范围内用常规软件工具进行捕捉、管理和处理数据集合。
  2. 经典案例:(1)啤酒与尿布                  (2)谷歌与流感
  3. 大数据的范围:采集、存储、搜索、共享、传输、分析和可视化。
  4. 内存:运行速度。
  5. 存储:储存容量。
  6. 海量数据产生:(1)来自大人群互联网 

                                  (2)来自大量传感器机械

                                  (3)科学研究及行业多结构专业数据

1887—1890年:电功器

1994年:预见大数据

1997年:用大数据描述超级计算机产生的大量信息。

2003—2006年:谷歌提出大数据可重用方案。

2008年:提出大数据概念。

2009年:大数据逐渐走进互联网。

2012年:大数据成为一种新的资产类别。

2013年:大数据元年

1ZB=10亿TB

各数据量单位:KB>MB>GB>TB>PB>EB>ZB>YB>NB>DB

单位以PB衡量的数据可称为大数据。

1字节(8位)→1个英文字母或二进制8位数

1文字=2字节=16位

1.2第四范式

实验(第一范式)→理论(第二范式)→计算(第三范式)→数据(第四范式)

1.大数据的特征

  (1) 大量化 (存储量大、  增量大)

  (2)多样化【来源多(搜索引擎、    社交网络);  格式多(结构化数据、  非结构化数据)】

    (3) 快速化

  (4)  有价值                              

 2.企业推动大数据

 

1.3大数据的关键技术

1.大数据预处理技术:数据采集、 数据存取 、基础架构支持 、计算结果展示

2.大数据存储技术:储存设备能持久可靠的的存储数据 、提供可伸缩接口 、提供高效查询,更新等操作

3.大数据分析技术:数据处理 、统计和分析 、数据挖掘 、模型预测

4.大数据计算技术

1.4大数据的典型计算架构

Haddop→处理本地数据

Spark→收集并更新

Storm→延迟毫秒级

云计算概述

无处不在的云计算:电子日历、电子导航、钉钉等

什么是云计算?

像水,电,煤(资源性产品)一样利用你的it资源(计算机储存网络资源)

关键词:按需使用,超大规模,高弹性

定义:指按需使用it资源和应用程序,通过互联网按使用量付费。

四种云:

  1. 公有云:提供公共的IT资源              缺点:保密性低
  2. 私有云:提供给政府,学校等地       优点:保密性高
  3. 社区云:研究人员使用
  4. 混合云:包含以上任意两种

生活中的例子:

  1. 出行论:自己买车开车(混合云)
  2. 吃饭论:餐厅(公有云)在家做饭(私有云)
  3. 酒店论:酒店(公有云)家(私有云)

2.1云计算的基本特征

  1. 资源无限量供应
  2. 提供自助式服务
  3. 远程提供服务
  4. 资源可控
  5. 按使用量付费

2.2云计算的发展背景

1.20世纪60年代,计算机革命

2.20世纪90年代,互联网革命

1994年weblo(单向传递)

2004年weblo(双向传递)

3.2010年,移动互联网革命

2.4云计算模下的it建设

特点:

  1. 开放硬件平台,软件与硬件解藕
  2. it建设的传统ioe架构转向互联网架构
  3. 分布式设计软件定义储存
  4. 集中资源池的共享,虚拟化,分时共享
  5. 动态调配,弹性伸缩,低成本,标准化硬件
  6. 芯片新介质取得突破(云计算IT的基础)

优点:省时省力省电省钱省人省地

2.5云计算的特点

  1. 虚拟化技术
  2. 动态可扩展性
  3. 按需部署
  4. 灵活性高
  5. 可靠性高
  6. 性价比高
  7. 地理分布
  8. 先进安全技术

2.6云计算的主要服务模式

IaaS 第一层

SaaS 第二层

PaaS 第三层

1.Iaas【基础设施即服务(租用)】       关键技术:虚拟化技术

2.SaaS【平台即服务(编程)】            数据库服务web应用   

特点:(1)简化开发人员

           (2)提供pc端或软件端的开发套件

           (3)丰富的开发环境

           (4)完全可托管的数据化服务

           (5)可配置式的应用程序的构建

           (6)支持多语言的开发

           (7)面向市场

关键技术:(1)分布式并计算         (2)分布式储存

3.SaaS【软件即服务(用户)】        关键技术:多租户技术

4.三种服务的区别

(1)IaaS(最低层) → 提供基础设施服务

(2)PaaS(提供软件)→  部署平台

(3)SaaS(拿来即用)例如:云计算服务=做饭做餐

                                                  云计算服务商=饭店            

          IaaS=提供厨房,锅具等(不提供食材和技术)

           PAAS → 提供厨房切好的食材(不提供技术)

           SaaS → 提供厨房,食材,技术

           IaaS → 租车

           PaaS → 租车+司机

           SaaS → 坐公交

三虚拟化技术

1.什么是虚拟化?

作为一种计算机资源管理技术将各种的工厂实体资源抽象的转化为另一种形式的技术

2.云计算与虚拟化有什么关系?

云计算1.0 → 以虚拟化为核心

云计算2.0 → 以资源为核心

云计算3.0 → 以应用为核心

云计算:一种服务

虚拟化:一种技术基础

物理机:(1)操作系统:Host  OS

               (2)硬件:Host  Machine

虚拟机:(1)操作系统:Guest  OS

               (2)虚拟机:Guest  Machine

               (3)VMM(虚拟监控器)

               (4)硬件:Host  Machine

 4.虚拟化的特点

  (1)区分 → 可分为多个虚拟机

(2)隔离 → 虚拟机与虚拟机之间相互独立

(3)封装 → 独立的文件夹形式

(4)相对于硬件独立 → 屏蔽底层硬件不兼容问题

5.虚拟化类型

一.寄居虚拟化:在主操作系统上安装和运行的一个程序

特点:(1)简单易于实现

           (2)安装和运行应用程序时依赖于主操作系统对设备的支持

           (3)有两层OS管理开销大性能损耗大

            (4)虚拟机对各种物理主机的调用都是通过虚拟化层和宿主OS一起调用完成

二.裸金属虚拟化 → 在硬件上部署虚拟化层

 特点:

(1)不依赖于操作系统

(2)支持多种操作系统

(3)依赖虚拟层内核和服务控制台进行管理

(4)需要对虚拟层进行内核开发

三.混合虚拟化 → 插入内核模块

 操作系统:KVM

特点

(1)相对于寄居虚拟化性能高

(2)相对于裸金属虚拟化不需要内核开发

(3)支持多种操作系统

(4)需要底层硬件支持虚拟扩展功能

6.虚拟化层构架:

全虚拟化(KVM),半虚拟化(Xen),硬件辅助虚拟化

(1)全虚拟化:

即所抽象的VM具有完全的物理特性虚拟化层负责捕获CPU指令,为指令访问硬件充当媒介

特点:OS无需修改  速度和功能比较好  使用非常简单  移植性好

 

 (2)半虚拟化:

 特点:架构更简单  对OS进行修改 用户体验比较麻烦  速度上占一定优势 

(3)硬件辅助虚拟化

7.虚拟化技术的优势和劣势

优势:(1)减少物理资源的投入节约成本

           (2)虚拟化数据资源迁移方便

           (3)提高物理资源的使用率

           (4)高价环保节省能源

           (5)易于自动化维护与操作减少维护成本

            (6)数据安全更有保障

劣势:(1)目前此界没有统一的虚拟化技术标准平台没有开放的协议

           (2)如果没有对数据进行备份用虚拟化技术会存在一定的风险

           (3)虚拟化数据中心的迁移特别是对在线服务的迁移对用户影响巨大

8.全虚拟化与半虚拟化举例对比

       KVM(性能)                                Xen(安全)

(1)全虚拟化                               (1)半虚拟化

(2)内置在内核中                        (2)需要修改内核

(3)便于版本安装升级维护          (3)更新版本重新编辑整个内核

(4)性能高                                   (4)隔离好

有关大数据与云计算的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby-on-rails - 使用一系列等级计算字母等级 - 2

    这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,

  3. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  4. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  5. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  6. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

  7. 使用canal同步MySQL数据到ES - 2

    文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co

  8. ruby-on-rails - 创建 ruby​​ 数据库时惰性符号绑定(bind)失败 - 2

    我正在尝试在Rails上安装ruby​​,到目前为止一切都已安装,但是当我尝试使用rakedb:create创建数据库时,我收到一个奇怪的错误:dyld:lazysymbolbindingfailed:Symbolnotfound:_mysql_get_client_infoReferencedfrom:/Library/Ruby/Gems/1.8/gems/mysql2-0.3.11/lib/mysql2/mysql2.bundleExpectedin:flatnamespacedyld:Symbolnotfound:_mysql_get_client_infoReferencedf

  9. STM32读取串口传感器数据(颗粒物传感器,主动上传) - 2

    文章目录1.开发板选择*用到的资源2.串口通信(个人理解)3.代码分析(注释比较详细)1.主函数2.串口1配置3.串口2配置以及中断函数4.注意问题5.源码链接1.开发板选择我用的是STM32F103RCT6的板子,不过代码大概在F103系列的板子上都可以运行,我试过在野火103的霸道板上也可以,主要看一下串口对应的引脚一不一样就行了,不一样的就更改一下。*用到的资源keil5软件这里用到了两个串口资源,采集数据一个,串口通信一个,板子对应引脚如下:串口1,TX:PA9,RX:PA10串口2,TX:PA2,RX:PA32.串口通信(个人理解)我就从串口采集传感器数据这个过程说一下我自己的理解,

  10. SPI接收数据异常问题总结 - 2

    SPI接收数据左移一位问题目录SPI接收数据左移一位问题一、问题描述二、问题分析三、探究原理四、经验总结最近在工作在学习调试SPI的过程中遇到一个问题——接收数据整体向左移了一位(1bit)。SPI数据收发是数据交换,因此接收数据时从第二个字节开始才是有效数据,也就是数据整体向右移一个字节(1byte)。请教前辈之后也没有得到解决,通过在网上查阅前人经验终于解决问题,所以写一个避坑经验总结。实际背景:MCU与一款芯片使用spi通信,MCU作为主机,芯片作为从机。这款芯片采用的是它规定的六线SPI,多了两根线:RDY和INT,这样从机就可以主动请求主机给主机发送数据了。一、问题描述根据从机芯片手

随机推荐