課程描述INTRODUCTION
Hadoop大數(shù)據(jù)平臺(tái)課程培訓(xùn)



日程安排SCHEDULE
課程大綱Syllabus
Hadoop大數(shù)據(jù)平臺(tái)課程培訓(xùn)
【課程背景】
數(shù)字化浪潮是人類正在經(jīng)歷的第五次信息革命。數(shù)字化一方面使得信息的搜集、存儲(chǔ)、處理、分發(fā)具有了前所未有的效率;另一方面,使得信息從其附著物上分離出來,得以獨(dú)立于實(shí)物、空間和時(shí)間而存在。數(shù)字化是大數(shù)據(jù)的根本。大數(shù)據(jù)的本質(zhì)是對(duì)事物規(guī)律的深刻洞察。學(xué)習(xí)大數(shù)據(jù)需要掌握其特征描述,包括大數(shù)據(jù)的技術(shù)特征和大數(shù)據(jù)的價(jià)值邏輯。本次課程授課范圍為大數(shù)據(jù)的技術(shù)特征。本課程分為理論和實(shí)踐兩部分。理論部分主要帶學(xué)員了解大數(shù)據(jù)的基本概念和關(guān)鍵技術(shù),介紹當(dāng)前大數(shù)據(jù)平臺(tái)的基本架構(gòu),重點(diǎn)介紹Hadoop生態(tài)系統(tǒng)框架及其HDFS、YARN、MapReduce2.0、Hbase、Zookeeper等組件的原理及應(yīng)用。帶學(xué)員了解Hadoop大數(shù)據(jù)平臺(tái)的運(yùn)維,幫助學(xué)員建立完整的大數(shù)據(jù)認(rèn)知體系。實(shí)踐課程為Hadoop實(shí)驗(yàn)課程。帶領(lǐng)學(xué)員動(dòng)手搭建Hadoop環(huán)境,完成Spark計(jì)算框架的搭建,完成XXX和XXX兩個(gè)操作實(shí)驗(yàn)。
【課程特點(diǎn)】
授課形式:理論講解+動(dòng)手實(shí)驗(yàn)
時(shí)間安排:系統(tǒng)學(xué)習(xí)1天(6小時(shí))
理論講解與動(dòng)手實(shí)驗(yàn)相結(jié)合。其中理論講解占50%,動(dòng)手實(shí)驗(yàn)占50%。
【課程收益】
1.了解大數(shù)據(jù)的基本概念、發(fā)展歷程、主流技術(shù)和應(yīng)用場(chǎng)景等。通過分析大數(shù)據(jù)平臺(tái)在建設(shè)、生產(chǎn)和運(yùn)維過程中出現(xiàn)的問題,幫助學(xué)員逐步形成解決問題的思路。
2.通過實(shí)驗(yàn)課程掌握Hadoop生態(tài)系統(tǒng)基本組件的運(yùn)用。學(xué)會(huì)使用MapReduce和Spark計(jì)算框架解決實(shí)際問題。
【受眾對(duì)象】
1.云計(jì)算和電信行業(yè)領(lǐng)域的技術(shù)人員、管理人員、政企客戶經(jīng)理、產(chǎn)品經(jīng)理、項(xiàng)目經(jīng)理
2.管理支持組織中數(shù)據(jù)中心運(yùn)行、規(guī)劃、設(shè)計(jì)負(fù)責(zé)人
3.希望提升自身職業(yè)能力的人員、其他對(duì)大數(shù)據(jù)技術(shù)感興趣的人員
【課程內(nèi)容】
一.大數(shù)據(jù)基本概念及關(guān)鍵技術(shù)
1.大數(shù)據(jù)的基本概念
●信息革命與數(shù)字化浪潮
●大數(shù)據(jù)的產(chǎn)生背景定義和特征
●大數(shù)據(jù)與云計(jì)算的關(guān)系
●大數(shù)據(jù)的影響
●大數(shù)據(jù)在行業(yè)的價(jià)值體現(xiàn)
2.大數(shù)據(jù)的關(guān)鍵技術(shù)
●傳統(tǒng)架構(gòu)的局限性
●大數(shù)據(jù)理論基礎(chǔ)
●大數(shù)據(jù)總體架構(gòu)和關(guān)鍵技術(shù)
●大數(shù)據(jù)匯聚
●大數(shù)據(jù)處理
●大數(shù)據(jù)分析
●大數(shù)據(jù)展現(xiàn)
●大數(shù)據(jù)開放
二.大數(shù)據(jù)平臺(tái)架構(gòu)
1.大數(shù)據(jù)平臺(tái)詳細(xì)架構(gòu)
●大數(shù)據(jù)平臺(tái)功能邏輯架構(gòu)
●Hadoop集群架構(gòu)
●MPP集群架構(gòu)
●流處理+內(nèi)存數(shù)據(jù)庫架構(gòu)
●大數(shù)據(jù)平臺(tái)數(shù)據(jù)流程
●大數(shù)據(jù)平臺(tái)的管理
●大數(shù)據(jù)平臺(tái)能力開放
2.行業(yè)大數(shù)據(jù)平臺(tái)
●某運(yùn)營商大數(shù)據(jù)平臺(tái)
●某銀行大數(shù)據(jù)平臺(tái)
●某互聯(lián)網(wǎng)公司大數(shù)據(jù)平臺(tái)
三.Hadoop生態(tài)系統(tǒng)
1.初識(shí)Hadoop
●Hadoop生態(tài)系統(tǒng)
●Hadoop歷史版本變遷介紹
●Hadoop基本組件
2.Hadoop三大組件的原理
●分布式文件系統(tǒng)原理
●HDFS原理
●HDFS讀寫過程
●MapReduce基本原理
●MapReduce框架
●Wordcount案例
●MapReduce內(nèi)部邏輯
●資源管理系統(tǒng)YARN
●YARN的作用
●YARN的基本原理
3.Hadoop生態(tài)系統(tǒng)
●Hadoop1.0~Hadoop3.0演進(jìn)歷史
●Hive和Pig優(yōu)劣勢(shì)
●Mahout工具
●Hbase原理
●Hbase數(shù)據(jù)模型
●Hbase物理模型
●ZooKeeper
●Sqoop
●Flume
四.Hadoop平臺(tái)運(yùn)維
1.Hadoop平臺(tái)運(yùn)維
●自動(dòng)擴(kuò)縮容
●資源監(jiān)控
●資源分配管理
●權(quán)限管理
●平臺(tái)容災(zāi)
2.Hadoop平臺(tái)運(yùn)維案例
●Hadoop集群訪問安全控制
●Hadoop存儲(chǔ)共享計(jì)算隔離設(shè)計(jì)
●實(shí)時(shí)查詢庫Hbase多實(shí)例
●Flume集群高可用
●HDFS磁盤檢查機(jī)制優(yōu)化
五.動(dòng)手實(shí)驗(yàn)
1)Hadoop安裝
●Hadoop安裝-獲取linux操作系統(tǒng)
●Hadoop安裝-安裝JDK
●Hadoop安裝-配置hadoop
2)Hadoop的核心-HDFS簡(jiǎn)介
●數(shù)據(jù)管理策略
●HDFS特點(diǎn)
●HDFS文件讀寫操作
3)Hadoop的核心-MapReduce原理與實(shí)現(xiàn)
●MapReduce的原理
●MapReduce的運(yùn)行流程
●實(shí)驗(yàn)一:WordCount單詞計(jì)數(shù)實(shí)例
●分片輸入—Map—Shuffle—Reduce過程總結(jié)
4)開發(fā)Hadoop應(yīng)用程序
●相似度算法
●基于物品的推薦算法原理
●基于物品的推薦算法實(shí)戰(zhàn)
●實(shí)驗(yàn)總結(jié)
補(bǔ)充章節(jié) 人工智能
1)未來已來
2)人工智能概念和應(yīng)用
3)機(jī)器學(xué)習(xí)原理
4)云計(jì)算和大數(shù)據(jù)驅(qū)動(dòng)深度學(xué)習(xí)
5)機(jī)器學(xué)習(xí)平臺(tái)架構(gòu)
Hadoop大數(shù)據(jù)平臺(tái)課程培訓(xùn)
轉(zhuǎn)載:http://m.xvaqeci.cn/gkk_detail/36883.html
已開課時(shí)間Have start time
- 唐杰
大數(shù)據(jù)課程內(nèi)訓(xùn)
- 數(shù)字技術(shù)與數(shù)字工具應(yīng)用 王文琭
- 醫(yī)療行業(yè)數(shù)字化營銷趨勢(shì)及實(shí) 王文琭
- 《銀行數(shù)據(jù)驅(qū)動(dòng)經(jīng)營方法論與 宗錦(
- 《核心客戶深度經(jīng)營與價(jià)值倍 龍?chǎng)?/span>
- 數(shù)字經(jīng)濟(jì)與數(shù)據(jù)技術(shù)應(yīng)用與變 王文琭
- 《跨境電商全鏈路AI賦能轉(zhuǎn) 黃光偉
- 數(shù)字時(shí)代下的營銷趨勢(shì) 韓天成
- 數(shù)字經(jīng)濟(jì)時(shí)代銀行開展數(shù)字化 李勇
- 政府?dāng)?shù)字化轉(zhuǎn)型實(shí)務(wù) 焦波
- 《微信公眾號(hào)精細(xì)化運(yùn)營》 崔成飛
- 社區(qū)商業(yè)零售數(shù)字化轉(zhuǎn)型 胡國慶
- 以需求為導(dǎo)向的大數(shù)據(jù)精準(zhǔn)營 張世民