草庐IT

大数据与云计算

母广亿 2023-08-09 原文

第一章.云计算

云计算概述

无处不在的云计算:电子日历、地图导航、钉钉……

什么是云计算?

像水电煤一样利用你的IT资源

水电煤——资源型产品

IT资源——计算机存储网络资源

关键词:按需使用,超大规模、高弹性

定义:指按需所雇佣IT资源和应用程序,通过互联网,按使用量付费

四种云

  1. 公有云——提供公共的IT资源

缺点:保密性较低

  1. 私有云——提供给政府,学校等地

优点:保密性高

  1. 社区云——研究人员使用
  2. 混合云——包含任意两种以上

生活中的例子:

  1. 出行论

自己买车(私有云)开车(公有云)————混合云

  1. 吃饭论

餐厅——公有云

在家做饭——私有云

在家+厨师——混合云

  1. 酒店论

酒店——公有云

家——私有云

一.云计算的基本特征

1.资源无限

2.提供自助式服务

3.远程提供服务

4.资源可控

5.按使用量付费

二.云计算的发展背景

1.20世纪60年代,计算机革命

2.20世纪 90年代,互联网革命

  1994年——Weblo(单向传递)

2004年——Weblo(双向传递)

3.2010年,移动互联网革命

三.云计算模下的IT建设

特点:1开放硬件平台,软件设计与硬件解耦

2.分布式设计、软件定义存储

3.IT建设的传统IEO架构,转向互联网架构

4.集中资源池的共享、虚拟化、分时共享

5.动态调整、弹性伸缩、低成本标准化硬件

6.芯片信介质取得突破(云计算IT的基础)

优点:省时,省力、省钱、省电、省人、省地。

四.云计算的特点

1.虚拟化技术

2.动态可扩展性

3.按需部署

4.灵活性高

5.可靠性高

6.性价比高

7.地理分布

8.先进的安全技术

五.云计算的主要服务模式

1.IaaS【第一层】(基础设施即服务)租用

关键技术:虚拟化技术

2.PaaS【第二层】(平台即服务)编程

数据库服务、Web应用

特点:1简化开发人员

          2.提供pc端或软件端的开发套件

          3.丰富的开发环境

          4.完全可托管的数据库服务

          5.可配置式的应用程序的构建

          6.支持多语言开发

          7.面向市场

关键技术:1.分布式计算2.分布式存储

3.SaaS【第三层】(软件即服务)用户

关键技术:多租户技术

4.三种服务的区别

(1)IaaS——最低层——提供基础服务

(2)PaaS——提供软件——部署平台

(3)SaaS——拿来即用

例:云计算服务=做饭做菜

  云计算服务提供商=饭店

  IaaS=提供厨房、锅具等、不提供食材和技术。

 PaaS——提供厨房、切好的食物  不提供技术

SaaS——提供厨房、食材、技术

IaaS——租车

PaaS——租车+司机

SaaS——坐公交

第二章大数据技术的概述

2.1大数据的定义:

在一定的时间范围内用常规软件工具进行捕获,管理和处理数据集合。

经典案例:1啤酒与尿布

          2.谷歌与流感

大数据的范围:采集,储存,搜索,共享,传输,分析和可视化。

内存:运行速度

储存:储存容量

海量数据的产生:1.来自大人群互联网

                             2.来自大量传感器机械

                              3.科学研究及行业多结构专业数据

大数据概念的提出:

1887——1890年:电功器

1944年:预见大数据

1997年:用大数据描述超级计算机产生的大量信息

2003——2006:谷歌提出大数据可重用方案

2008年:提出大数据概念

2009年大叔级逐渐走进互联网

2012年:大叔级成为一种新的资产类别

2013年:大数据元年

1ZB=10亿TB

各数据计量单位:KB<MB<GB<TB<PB<EB<ZB<YB<NB<DB

单位以PB衡量的书记可称为大数据

1位(二进制1或0)

1字节(8位)——>1个英文字母或2进制8位数

1文字=2字节=16位

2.2第四范式

  1. 实验(第一范式)
  2. 理论(第二范式)
  3. 计算(第三范式)
  4. 数据(第四范式)

2.3大数据的特征:

1.大量化

(1)储存量大

(2)增量大

2.多样化

  (1)来源多

     1搜索引擎

     2社交网络

  1. 格式多

1结构化数据

2非结构化数据

   3.快速化 有价值

企业推动大数据:腾讯、阿里、数据库、ETC、谷歌、华为。

2.3大数据的关键技术:

  • 大数据预处理技术:1数据采集 2.数据存取 3.基础架构支持  4.计算机结果展示
  • 大数据存储技术:1储存设备能持久可靠的存储数据2.提供可伸缩接口3.提供高效查询、更新等操作
  • 大数据分析技术:1数据处理2.统计与分析3.数据挖掘4.模型预测
  • 大数据计算技术

2.4大数据的典型计算架构:

Hadoop——处理本地数据

Spark——收集并更新

Storm——延迟毫秒级

第三章.虚拟化技术

3.1什么是虚拟化技术:

作为一种计算机资源管理技术,将各种IT实体资源抽象转化为另一种形式的技术

3.2云计算与虚拟化有什么关系?

云计算1.0——以虚拟化为核心

云计算2.0——以资源为核心

云计算3.0——以应用为核心

云计算:一种服务

虚拟化:一种技术基础

物理机   操作系统(Host  OS)

             硬件(Host  Machine)

虚拟机   操作系统(Guest  OS)

              虚拟机(Guest  Machine)

              VMM(虚拟监控器)

              硬件 (Host  Machine)

3.3虚拟化的特点

1.分区——可分为多个虚拟机

2.隔离——虚拟机与虚拟机之间相互独立

3.封装——独立的文件夹形式

4.相对于硬件独立——屏蔽底层硬件不兼容问题

3.4虚拟化类型

1.寄居虚拟化——在主操作系统上安装和运行一个程序

操作系统:VMware、Workstation等

特点:1.简单易于实现

           2.安装和运行程序是,依赖于主操作系统对设备的支持

           3.有两层OS,管理开销大,性能损耗大

           4.虚拟机对各种物理主机的调用都是通过虚拟化层和宿主OS一起调用完成

 2.裸金属虚拟化——在硬件上部署虚拟化层   

操作系统:VMware、Esx、Xen等

特点:1.不依赖于操作系统

          2.支持多种操作系统

          3.依赖虚拟化层内核和服务控制台进行管理

          4.需要对虚拟层进行内核开发

3.混合虚拟化——插入内核模块

操作系统:Kvm

特点:1.相对于寄居虚拟化性能高

          2.相对于裸金属虚拟化不需要内核开发

          3.支持多种操作系统

          4.需要底层硬件支持虚拟扩展功能

3.5虚拟化层架构

全虚拟化——Kvm、半虚拟化——Xen、硬件辅助虚拟化

1.全虚拟化:即所抽象的VM既有完全的物理特征,虚拟化层负责捕获

                  cpu指令,为指令访问硬件充当媒介

特点:1.OS无需修改

          2.速度和功能比较好,使用非常简单

          3.移植性好

2.半虚拟化:

特点:1.架构更简单

          2.对OS进行修改,用户体验比较麻烦

          3.速度上占一定优势

3.硬件辅助虚拟化

3.6虚拟化技术的优势和劣势

1.优势:(1)减少物理资源的投入,节约成本

           (2)虚拟数据资源迁移方便

           (3)提高物理资源的使用率

           (4)更加环保,节省能源

           (5)易于自动化维护与操作,减少维护成本

           (6)数据安全更有保障

2.劣势:  (1)目前业界没有统一的虚拟化技术标准与平台没有开放的

                协议。

                (2)如果没有对数据进行备份,应用虚拟化技术会存在一定的风险

                (3)虚拟数据中心的迁移,特别是对在线服务的迁移,对用户影响巨大

3.7全虚拟化与半虚拟化举例对比

KVM(性能)

1.全虚拟化

2.内置在内核中

3.便于版本安装、升级、维护

4.性能高

Xen(安全)

1.半虚拟化

2.需要修改内核

3.更新版本,重新编辑整个内核

4.隔离好

第四章.云计算与大数据技术应用 

4.1数据中心的概念

数据中心,顾名思义就是数据的中心,是处理和存储海量数据的地方,英文全称为Data Center。用专业的名词解释,数据中心是全球协作的特定设备网络,用来在internet网络基础设施上传递、加速、展示、计算、存储数据信息。

4.2数据中心的发展历程

1.巨型机时代

2.pc时代

3.云计算大数据时代

4.3数据中心的基本单元----服务器

1.塔式服务器

2.机架式服务器

4.4数据中心的主要节能措施

1.调高数据中心温度

2.评估数据中心设备运行情况

3.虚拟化技术的应用

4.及时关闭不必要的用电设备

有关大数据与云计算的更多相关文章

  1. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  2. ruby-on-rails - 使用一系列等级计算字母等级 - 2

    这里是Ruby新手。完成一些练习后碰壁了。练习:计算一系列成绩的字母等级创建一个方法get_grade来接受测试分数数组。数组中的每个分数应介于0和100之间,其中100是最大分数。计算平均分并将字母等级作为字符串返回,即“A”、“B”、“C”、“D”、“E”或“F”。我一直返回错误:avg.rb:1:syntaxerror,unexpectedtLBRACK,expecting')'defget_grade([100,90,80])^avg.rb:1:syntaxerror,unexpected')',expecting$end这是我目前所拥有的。我想坚持使用下面的方法或.join,

  3. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  4. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  5. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  6. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

  7. 使用canal同步MySQL数据到ES - 2

    文章目录一、概述简介原理模块二、配置Mysql使用版本环境要求1.操作系统2.mysql要求三、配置canal-server离线下载在线下载上传解压修改配置单机配置集群配置分库分表配置1.修改全局配置2.实例配置垂直分库水平分库3.修改group-instance.xml4.启动监听四、配置canal-adapter1修改启动配置2配置映射文件3启动ES数据同步查询所有订阅同步数据同步开关启动4.验证五、配置canal-admin一、概述简介canal是Alibaba旗下的一款开源项目,Java开发。基于数据库增量日志解析,提供增量数据订阅&消费。Git地址:https://github.co

  8. ruby-on-rails - 创建 ruby​​ 数据库时惰性符号绑定(bind)失败 - 2

    我正在尝试在Rails上安装ruby​​,到目前为止一切都已安装,但是当我尝试使用rakedb:create创建数据库时,我收到一个奇怪的错误:dyld:lazysymbolbindingfailed:Symbolnotfound:_mysql_get_client_infoReferencedfrom:/Library/Ruby/Gems/1.8/gems/mysql2-0.3.11/lib/mysql2/mysql2.bundleExpectedin:flatnamespacedyld:Symbolnotfound:_mysql_get_client_infoReferencedf

  9. STM32读取串口传感器数据(颗粒物传感器,主动上传) - 2

    文章目录1.开发板选择*用到的资源2.串口通信(个人理解)3.代码分析(注释比较详细)1.主函数2.串口1配置3.串口2配置以及中断函数4.注意问题5.源码链接1.开发板选择我用的是STM32F103RCT6的板子,不过代码大概在F103系列的板子上都可以运行,我试过在野火103的霸道板上也可以,主要看一下串口对应的引脚一不一样就行了,不一样的就更改一下。*用到的资源keil5软件这里用到了两个串口资源,采集数据一个,串口通信一个,板子对应引脚如下:串口1,TX:PA9,RX:PA10串口2,TX:PA2,RX:PA32.串口通信(个人理解)我就从串口采集传感器数据这个过程说一下我自己的理解,

  10. SPI接收数据异常问题总结 - 2

    SPI接收数据左移一位问题目录SPI接收数据左移一位问题一、问题描述二、问题分析三、探究原理四、经验总结最近在工作在学习调试SPI的过程中遇到一个问题——接收数据整体向左移了一位(1bit)。SPI数据收发是数据交换,因此接收数据时从第二个字节开始才是有效数据,也就是数据整体向右移一个字节(1byte)。请教前辈之后也没有得到解决,通过在网上查阅前人经验终于解决问题,所以写一个避坑经验总结。实际背景:MCU与一款芯片使用spi通信,MCU作为主机,芯片作为从机。这款芯片采用的是它规定的六线SPI,多了两根线:RDY和INT,这样从机就可以主动请求主机给主机发送数据了。一、问题描述根据从机芯片手

随机推荐