admin 管理员组

文章数量: 1184232


2024年3月20日发(作者:web用户是什么意思啊)

1

初识Hadoop大数据技术

本章主要介绍大数据的时代背景,给出了大数据的概念、特征,还介绍了大数据相关问题的

解决方案、Hadoop大数据技术以及Hadoop的应用案例。

本章的主要内容如下。

(1)大数据技术概述。

(2)Google的三篇论文及其思想。

(3)Hadoop概述。

(4)Hadoop生态圈。

(5)Hadoop的典型应用场景和应用架构。

1.1 大数据技术概述

1.1.1 大数据产生的背景

1946年,计算机诞生,当时的数据与应用紧密捆绑在文件中,彼此不分。19世纪60年代,

IT系统规模和复杂度变大,数据与应用分离的需求开始产生,数据库技术开始萌芽并蓬勃发展,

并在1990年后逐步统一到以关系型数据库为主导,具体发展阶段如图1-1所示。

1

Hadoop大数据技术与应用

19世纪60年代,IT系统规模和复杂度变大,数据与应

用分离的需求开始产生,数据库技术开始萌芽并蓬勃发

展,并在1990年后逐步统一到以关系型数据库为主导

1946年,计算机诞生,

数据与应用紧密捆绑

在文件中,彼此不分

E-R

网络型

磁盘被

发明,

进入文

件管理

时代

GE公司发

明第一个网

络模型数据

库,但仅限

于GE自己

的主机

关系型

SQL

数据库

ORACLE

SQL语言

发布第一

IBM E.

被发明

个商用

SQL关系

提出关

数据库,

系模型

后续快速

发展

1974 1979

数据仓库

数据仓库开

始涌现,关

系数据库开

始全面普及

且与平台无

关,数据管

理技术进入

成熟期

2001

第一台

计算机

ENIAC

面世

1946

磁带+

卡片

人工

管理

1951

图1-1 数据管理技术在2001年前的两个发展阶段

1956 1961 1970 1991

2001年后,互联网迅速发展,数据量成倍递增。据统计,目前,超过150亿个设备连接到互

联网,全球每秒钟发送290万封电子邮件,每天有2.88万小时视频上传到YouTube网站,Facebook

网站每日评论达32亿条,每天上传照片近3亿张,每月处理数据总量约130万TB。2016年全球

产生数据量16.1ZB,预计2020年将增长到35ZB(1ZB = 1百万,PB = 10亿TB),如图1-2所示。

IDC报告“Data Universe Study”

预测:全世界数据量将从2009

年的0.8ZB增长到2020年的

35ZB,增长44倍!年均增

长率>40%!

0.8ZB:将一堆

DVD堆起来够

地球到月亮一

个来回

35ZB:将一堆DVD

堆起来是地球到火

星距离的一半

图1-2 IDC数据量增长预测报告

2011年5月,EMC World 2011大会主题是“云计算相遇大数据”,会议除了聚焦EMC公司

一直倡导的云计算概念外,还抛出了“大数据”(BigData)的概念。2011年6月底,IBM、麦肯

锡等众多国外机构发布“大数据”相关研究报告,并予以积极的跟进。

2


本文标签: 数据 应用 技术 数据量 开始