Hadoop大数据分析入门课程汇总

培训教学 潘老师 2年前 (2021-02-24) 1760 ℃ (0) 扫码查看

Hadoop大数据分析入门系列课程潘老师已经汇总如下:

初识大数据,了解大数据起源背景及其4V特点

文章目录展开 1.大数据起源与背景 2.大数据的数据单位 3.大数据概念 4.大数据特点 5.大数据的价值 6 […]


初识Hadoop,了解Hadoop起源背景及其生态圈

文章目录展开 1.Hadoop起源于背景 2.Hadoop介绍 3.Hadoop组件 4.Hadoop 生态圈 […]

1)伪分布式环境搭建

Hadoop3.x伪分布式环境搭建图文详解教程,让你快速入门大数据开发

如果在你在网上搜Hadoop伪分布式环境搭建的教程,结果可谓五花八门,有的甚至漏洞百出,很难找到一篇非常详细的 […]


2)完全分布式环境搭建(授课电脑配置不够可以跳过)

Hadoop完全分布式环境搭建步骤

文章目录展开 一.说明: 二、具体步骤 一.说明: 1、伪分布式环境是一台虚拟机,自身既是主节点又是从节点,即 […]


NTP方式同步服务器时间,解决org.apache.hadoop.yarn.exceptions.YarnException: Unauthorized request to start container

文章目录展开 一、存在的问题 二、解决步骤: 一、存在的问题 Hadoop在完全分布式下多个虚拟主机协同运行时 […]


Hadoop完全分布式开启日志聚合功能

文章目录展开 一、说明 二、步骤 一、说明 Container日志是hadoop各个container记录的日 […]


windows配置hosts,实现通过主机名(域名)访问虚拟主机

文章目录展开 步骤 修改可能遇到问题 我们之前在windows系统上通过浏览器访问虚拟主机服务器时,基本都是通 […]

什么是DFS?DFS介绍及其结构

文章目录展开 1.DFS介绍 2.什么是DFS 3.DFS结构 1.DFS介绍 由于一台机器的存储容量有限,一 […]


HDFS核心概念、优缺点及其执行原理

文章目录展开 1.HDFS 的概念及体系结构 2.HDFS 的设计 3.HDFS 的优点和缺点 4.HDFS […]


Hadoop中HDFS 的常用命令

文章目录展开 1.对文件的操作 2.管理与更新 我们已经知道 HDFS 是分布式存储,可以存放大批量的文件,如 […]


HDFS应用—基于shell操作和基于Java API操作

文章目录展开 1.基于 Shell 的操作 2.基于 Java API 的操作 1.基于 Shell 的操作 […]


基于Java API实现HDFS文件的操作

文章目录展开 准备 代码实现 1、创建Maven项目 2、添加依赖 2、创建测试类 准备 使用Java API […]

MapReduce概述、优缺点及其典型应用场景

文章目录展开 1.概述 2.优缺点 3.典型应用场景 1.概述 MapReduce是一种分布式计算模型,由Go […]


MapReduce执行过程及运行原理详解

MapReduce执行过程及运行原理是非常复杂的,理解起来也极其困难,这也是许多同学在学习Hadoop过程中比 […]


MapReduce涉及类介绍及常用类型

文章目录展开 1、常用类: 2、数据类型: 1、常用类: 该类的作用是将输入的文件和数据分割成许多小的spli […]


Hadoop经典入门案例实战-WordCount单词统计代码实现及原理分析

Hadoop入门学习最经典的案例就是WordCount单词统计实战案例,这个案例可以帮你迅速理解hadoop中 […]


初步认识ETL,实现数据清洗入门案例

ETL,是Extract-Load-Transform的缩写,用来描述将数据从来源端经过抽取(extract) […]


Hadoop自定义对象序列化Writable和WritableComparable

文章目录展开 自定义对象根据Key和Value分为二种情况 自定义对象根据Key和Value分为二种情况 如果 […]


Hadoop经典综合性案例—温度排序示例

温度排序示例是一个综合性比较强的Hadoop经典案例,除了基础的MapReduce,还有自定义序列化对象、分区 […]

Yarn是什么及其产生背景?为什么要使用Yarn?

文章目录展开 1.YARN什么? 2.YARN产生背景 3.为什么要使用YARN? 1.YARN什么? YAR […]


Yarn基本架构及其主要角色

文章目录展开 1.基本架构 2.主要角色 1.基本架构 YARN是Hadoop2.0版本新引入的资源管理系统, […]


Yarn的工作流程

文章目录展开 1、首先我们来看YARN工作流程图: 2、YARN工作流程注意包括以下几个步骤: 1、首先我们来 […]


Yarn的三种调度策略

文章目录展开 1.FIFO策略: 2.容量调度策略: 3.公平调度策略: 3.Fair Scheduler 和 […]

Hadoop实战案例—直播数据统计与分析

文章目录展开 1、实现数据清洗 2、指标统计实现 3、实现TOP N统计 4、实现定时任务脚本 随着直播行业的 […]

ZooKeeper是什么?它有哪些核心概念

文章目录展开 一、ZooKeeper是什么? 二、ZooKeeper目标 三. ZooKeeper五大特性 四 […]


Linux如何安装Zookeeper(单机版和集群版模式)

文章目录展开 第1步:环境准备 第2步:下载安装包 第2步:上传解压 第3步:传安装 1、单机版安装 2、集群 […]


ZooKeeper常用指令及客户端连接相关操作

文章目录展开 一、ZooKeeper常用指令 二、客户端连接 一、ZooKeeper常用指令 1)启动指令 z […]


基于Java API访问ZooKeeper

文章目录展开 环境准备 知识准备 代码实现 我们可以使用Java API访问ZooKeeper,对ZooKee […]

什么是NoSQL非关系型数据库及与关系型数据库的区别

文章目录展开 什么是NoSQL? NoSQL诞生背景 NoSQL数据库分类 NoSQL 数据库的应用 NoSQ […]


HBase简介及其数据模型详解

文章目录展开 HBase 简介 HBase数据模型 数据模型图示: 核心概念: 数据模型举例理解: Hbase […]


HBase体系架构、组件及执行原理

文章目录展开 HBase体系架构及组件 组件: HBase 执行原理 本节内容主要介绍HBase体系架构中的各 […]


HBase下载、安装与配置(单机版与完全分布式模式)

文章目录展开 HBase官网下载 HBase安装与配置 HBase官网下载 HBase官网下载地址:点击去下载 […]


HBase的常用shell操作

本节内容我们主要讲解下HBase的常用shell操作。首先我我们要启动hbase: start-hbase.s […]


基于Java API访问操作HBase实例

文章目录展开 代码演示 HBase Shell可以基于后台访问HBase,本节将介绍如何基于Java API远 […]

Flume日志采集工具入门简介

文章目录展开 一、什么是Flume 二、Flume 的特点 1.事务 2.可靠性 3.多层代理 三、Flume […]


Flume安装与配置及Flume应用典型实例

文章目录展开 一、Flume安装 二、Flume典型应用 1、本地数据读取 2、收集至HDFS 3、基于日期分 […]


版权声明:本站所有文章,如无特殊说明,均为本站原创。转载请务必注明文章来源,谢谢支持。
本文链接:https://www.panziye.com/teach/1906.html
喜欢 (4)
请潘老师喝杯Coffee吧!】
分享 (0)
用户头像
发表我的评论
取消评论
表情 贴图 签到 代码

Hi,您需要填写昵称和邮箱!

  • 昵称【必填】
  • 邮箱【必填】
  • 网址【可选】