随着计算机网络基础设施的完善,社交网络和电商的发展以及物连网的推进,产生了越来越多的大数据,使得人工智能最近几年也有了长足的发展,大数据的存储和处理也越来越重要,国家对此也比较重视,学习大数据和人工智能的人也越来越多,hadoop是目前世界上最流行的分布式数据处理框架,是大数据学习必学的框架知识。
初学hadoop,最基础的也就是hdfs和mapreduce了,hdfs是一个分布式存储文件系统,mapreduce是一个分布式计算的框架,两者结合起来,就可以很容易做一些分布式处理任务了。
hadoop的学习可以从以下几个部分进行学习:
一、hadoop介绍和环境搭建。
1. hadoop生态环境介绍。
2. hadoop云计算中的位置和关系。
3. 国内外hadoop应用案例介绍。
4. hadoop概念、版本、历史。
5. hadoop核心组成介绍及hdfs、mapreduce体系结构。
6. hadoop独立模式安装和测试。
7. hadoop的集群结构。
8. hadoop伪分布的详细安装步骤。
9. 通过命令行和浏览器观察hadoop
10. hadoop启动脚本分析。
11. hadoop完全分布式环境搭建。
12. hadoop安全模式、**站介绍。
二、hdfs体系结构和shell以及j**a操作。
1. hdfs底层工作原理。
2. hdfsdatanode,namenode详解。
3. 单点故障(sp0f)和高可用(ha)
4. 通过api访问hdfs
5. 常用压缩算法介绍和安装使用。
6. m**en介绍和安装,eclipse中使用m**en,搭建m**en本地仓库。
三、mapreduce学习。
1. mapreduce四个阶段介绍。
2. job、task介绍。
3. 默认工作机制。
4. 创建mr应用开发,获取年度的最高气温。
5. 在windows上运行mr作业。
6. mapper、reducer
7. inputsplit和outputsplit
8. shuffle:sort,partitioner,group,combiner
9. 通过计数器调试程序。
10. 在windows安装hadoop
11. 在eclipse安装hadoop插件,访问hadoop资源。
12. 在eclipse中编写ant脚本。
13. yarn调度框架事件分发机制。
14. 远程调试资源管理器。
15. hadoop的底层google protobuf的协议分析。
16. hadoop底层ipc原理和rpc
四、hadoop高可用-ha
1. 集群结构体系介绍。
2. 集群搭建。
3. namenode的高可用性(ha)
4. hdfs federation
5. resourcemanager的高可用性(ha)
6. hadoop集群常见问题和解决办法。
以上是hadoop开发学习大纲,想学习hadoop框架技术的可以按照以上内容进行学习,很全面的讲解了hadoop知识!
Hadoop学习 1 LINUX环境熟悉
hadoop 1 linux环境熟悉。实验目的。hadoop生产环境都是依赖于linux环境,而部分学习人员只有windows平台使用经验,为保证后续各环节的顺利执行,需要让使用者熟悉linux环境的主要操作命令,理解分布式并行计算的核心。熟悉vim编辑器的使用方式,能够通过它来创建修改文件。如果学...
文员学习内容
随着计算机技术的飞速发展,计算机的应用越来越广泛,有越来越多的人员需要掌握计算机的基本知识及其使用方法。学习计算机知识已成为每个现代人的必修课程。1个单位是否使用办公自动化系统,已经成为信息化建设水平的重要标志之1,自动化办公的实现,将打破时间 空间的限制,无论是出差在外,还是在家只要通过访问官网就...
201503学习内容
6 严格执行安全规定。5.灭火的基本方法 1 窒息法 隔绝空气,使助燃气体 如氧 与燃烧物分开,就可停止燃烧。2 冷却法 降低燃烧物质的温度,当降到燃点以下,就停止燃烧。3 隔离法 将燃烧物质与未燃烧物质分开,使火势孤立,不致蔓延。4 化学抑制法 采用含氟 氯 嗅等化学剂,使链式反应中断,燃烧即停止...