大数据分析与Hadoop基础 Hadoop 是目前最主流的大数据处理框架之一,他是一个生态系统,包含很多组件,包括: HDFS(分布式文件系统),YARN(分布式资源调度系统),MapReduce(分布式计算系统)、Sqoop接口等。
当然突然接触到Hadoop,大家一定很困惑,Hadoop是什么?暂且不说抽象的概念,先说一些期实际应用:阿里巴巴采用了数十个Hadoop集群来处理从数据库中导出的商业数据;Ebay使用几十个节点组成的集群来存储数据,并长期使用Java编写的MapReduce应用,以及Pig、Hive、Hbase的组合应用以研究搜索优化;Facebook使用Hadoop来存储内部日志或结构化交易数据的源文件副本,将其作为机器学习、人工智能的数据源。说到这里,大家及时不知道Hadoop究竟是什么也想要去好好学习一下,并世界顶级公司都在使Hadoop生态系统。
实际上Hadoop不是一个单一的工具,而是一系列的分布式系统,我们可以运用其处理海量数据,而不用担心某一台服务器内存的限制。
CDA数据分析分布式集群架构与hadoop基础课程分为多个部分来讲解,首先需要强调的内容是Hadoop各个组件的认识、安装与简单运行。本部分内容以Hadoop发展为开端,并依次介绍Hadoop运行的Linux生态系统和CentOS操作系统的基础操作,并在此基础上引导学员逐步安装Habse、MapReduce、Sqoop、Hive等大数据组件从而搭建自己的大数据平台架构。 报名人数:27 课程有效期:1000天 ¥0原价 ¥0 立即购买
33节视频课 0个编程练习 0个随堂测试 企业级项目训练