博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop特点
阅读量:4881 次
发布时间:2019-06-11

本文共 593 字,大约阅读时间需要 1 分钟。

一:HDFS

1.HDFS上传数据,会将文件切分成指定大小的数据块,并以多副本的数据块存储在机器上.

2.

part0是指  副本有2个而且1,2有两个副本

二.YARN

1.负责整个集群的管理和调度

YARN的特点

 扩展性,容错性,多框架资源统一调度,支持多种不同的框架同时运行

 

 

 

 

 三.mapReduce

特点:扩展性,容错性,海量数据的离线处理

wordcount单词统计操作

先输入-在分割-在map看在一个块中出现了几次-shuffing洗牌在将相同的数据放在一起-Reducing统计-最后统计

 

四:hadoop优势

1.可以横向扩展,进行计算

2.存储在廉价的机器上面降低成本

3.成熟的生态圈

 

五:

1.hadoop生态系统开源社区活跃

2.囊括了大数据体系的方方面面

3.成熟的生态圈

 

六:

hadoop选型

apache hadoop(不推荐,依赖和冲突太多) 

CDH(推荐,安装方便,cdh如果版本相同的话基本没有冲突,cm(安装集群的框架不开源)):

HDP(国内的话不经常用但是比apache用的多缺点(安装和升级比较费劲))

七:

hadoop的使用案例

案例一:hadoop之消费大数据(电商用例) 

 根据历时用例来预测用户的消费情况

案例二:零售大数据'

 

转载于:https://www.cnblogs.com/chenligeng/p/9313752.html

你可能感兴趣的文章
java代码,在linux上删除文件
查看>>
jquery page
查看>>
技术类博客收集
查看>>
有监督学习、无监督学习、半监督学习
查看>>
linux显示完整目录
查看>>
简单的社交网络
查看>>
jeecg 实现lhgDialog窗口传值
查看>>
JSON初试
查看>>
欧拉计划 题目24 (全排列)
查看>>
Mysql基础2
查看>>
Math.floor,Math.ceil,Math.rint,Math.round用法
查看>>
HDU ACM 1495 非常可乐(广搜BFS)
查看>>
Java程序设计概述
查看>>
我的第一个Java程序
查看>>
eclipse Mac 快捷键
查看>>
浏览器下载代码
查看>>
第三天(1)自定义拦截器
查看>>
XML语言:可扩展的标记语言;
查看>>
Leetcode OJ : Implement strStr() [ Boyer–Moore string search algorithm ] python solution
查看>>
计算机网络概况(一)
查看>>