hadoop开发学习内容

发布 2021-05-01 21:59:28 阅读 2347

随着计算机网络基础设施的完善,社交网络和电商的发展以及物连网的推进,产生了越来越多的大数据,使得人工智能最近几年也有了长足的发展,大数据的存储和处理也越来越重要,国家对此也比较重视,学习大数据和人工智能的人也越来越多,hadoop是目前世界上最流行的分布式数据处理框架,是大数据学习必学的框架知识。

初学hadoop,最基础的也就是hdfs和mapreduce了,hdfs是一个分布式存储文件系统,mapreduce是一个分布式计算的框架,两者结合起来,就可以很容易做一些分布式处理任务了。

hadoop的学习可以从以下几个部分进行学习:

一、hadoop介绍和环境搭建。

1. hadoop生态环境介绍。

2. hadoop云计算中的位置和关系。

3. 国内外hadoop应用案例介绍。

4. hadoop概念、版本、历史。

5. hadoop核心组成介绍及hdfs、mapreduce体系结构。

6. hadoop独立模式安装和测试。

7. hadoop的集群结构。

8. hadoop伪分布的详细安装步骤。

9. 通过命令行和浏览器观察hadoop

10. hadoop启动脚本分析。

11. hadoop完全分布式环境搭建。

12. hadoop安全模式、**站介绍。

二、hdfs体系结构和shell以及j**a操作。

1. hdfs底层工作原理。

2. hdfsdatanode,namenode详解。

3. 单点故障(sp0f)和高可用(ha)

4. 通过api访问hdfs

5. 常用压缩算法介绍和安装使用。

6. m**en介绍和安装,eclipse中使用m**en,搭建m**en本地仓库。

三、mapreduce学习。

1. mapreduce四个阶段介绍。

2. job、task介绍。

3. 默认工作机制。

4. 创建mr应用开发,获取年度的最高气温。

5. 在windows上运行mr作业。

6. mapper、reducer

7. inputsplit和outputsplit

8. shuffle:sort,partitioner,group,combiner

9. 通过计数器调试程序。

10. 在windows安装hadoop

11. 在eclipse安装hadoop插件,访问hadoop资源。

12. 在eclipse中编写ant脚本。

13. yarn调度框架事件分发机制。

14. 远程调试资源管理器。

15. hadoop的底层google protobuf的协议分析。

16. hadoop底层ipc原理和rpc

四、hadoop高可用-ha

1. 集群结构体系介绍。

2. 集群搭建。

3. namenode的高可用性(ha)

4. hdfs federation

5. resourcemanager的高可用性(ha)

6. hadoop集群常见问题和解决办法。

以上是hadoop开发学习大纲,想学习hadoop框架技术的可以按照以上内容进行学习,很全面的讲解了hadoop知识!

Hadoop学习 1 LINUX环境熟悉

hadoop 1 linux环境熟悉。实验目的。hadoop生产环境都是依赖于linux环境,而部分学习人员只有windows平台使用经验,为保证后续各环节的顺利执行,需要让使用者熟悉linux环境的主要操作命令,理解分布式并行计算的核心。熟悉vim编辑器的使用方式,能够通过它来创建修改文件。如果学...

文员学习内容

随着计算机技术的飞速发展,计算机的应用越来越广泛,有越来越多的人员需要掌握计算机的基本知识及其使用方法。学习计算机知识已成为每个现代人的必修课程。1个单位是否使用办公自动化系统,已经成为信息化建设水平的重要标志之1,自动化办公的实现,将打破时间 空间的限制,无论是出差在外,还是在家只要通过访问官网就...

201503学习内容

6 严格执行安全规定。5.灭火的基本方法 1 窒息法 隔绝空气,使助燃气体 如氧 与燃烧物分开,就可停止燃烧。2 冷却法 降低燃烧物质的温度,当降到燃点以下,就停止燃烧。3 隔离法 将燃烧物质与未燃烧物质分开,使火势孤立,不致蔓延。4 化学抑制法 采用含氟 氯 嗅等化学剂,使链式反应中断,燃烧即停止...