課程目錄:用Spark和Python通過PySpark處理大數據培訓
4401 人關注
(78637/99817)
課程大綱:

       用Spark和Python通過PySpark處理大數據培訓

 

 

 

介紹

了解大數據

Spark概述

Python概述

PySpark概述

使用彈性分布式數據集框架分發數據
使用Spark API運算符分布計算
設置Python和Spark

設置PySpark

針對Spark使用Amazon Web Services(AWS)EC2實例

設置數據塊

設置AWS EMR集群

學習Python編程的基礎知識

Python入門
使用Jupyter Notebook
使用變量和簡單的數據類型
使用列表
使用 if 語句
使用用戶輸入
處理while循環
實現函數
使用類
處理文件和異常
處理項目、數據、API
學習Spark DataFrame的基礎知識

Spark DataFrames入門
用Spark實現基本操作
使用Groupby和聚合操作
使用時間戳和日期
進行Spark DataFrame項目練習

了解用MLlib進行機器學習

使用MLlib、Spark和Python進行機器學習

了解回歸

學習線性回歸理論
實現回歸評估代碼
進行線性回歸示例練習
學習Logistic回歸理論
實現一個Logistic回歸代碼
進行Logistic回歸示例練習
了解隨機森林(Random Forests)和決策樹(Decision Trees)

學習樹方法論(Tree Methods Theory)
實現決策樹和隨機森林代碼
進行隨機森林分類示例練習
使用K均值聚類

了解K均值聚類理論
實現K均值聚類代碼
進行群集示例練習
使用推薦系統

實現自然語言處理

理解自然語言處理(NLP)
NLP工具概述
進行NLP示例練習
在Python中用Spark進行流式處理

用Spark進行流式處理概述
Spark流數據處理(Spark Streaming)示例練習

主站蜘蛛池模板: 在线不卡免费视频| 老司机免费午夜精品视频| 日产精品1区至六区有限公司| 刚下班坐公交车被高c怎么办 | 欧美性猛交xxxxx按摩国内| 国产伦精品一区二区三区视频金莲| α片毛片免费看| 欧美大bbbxxx视频| 古代np多夫h肉辣文| 1313午夜精品理伦片| 波多野结衣久久| 国产午夜福利100集发布| a级毛片免费全部播放| 最近中文字幕2019国语3| 动漫乱人伦视频在线观看| 亚洲欧美另类视频| 成人毛片免费播放| 亚洲成a人片在线不卡一二三区| 88国产精品欧美一区二区三区| 日本中文字幕在线视频| 亚洲精品成人片在线播放| 骚虎影院在线观看| 在线观看视频国产| 五月天婷婷视频在线观看| 精品久久久久久亚洲精品| 国产福利一区二区三区在线观看| 中国大陆一级毛片| 杨幂下面好紧好湿好爽| 免费网站看V片在线18禁无码| 91在线你懂的| 在线观看av无需播放器| 中文字幕视频免费在线观看| 欧美日韩国产成人精品| 军人武警gay男同gvus69| 成人黄色免费网站| 国精产品wnw2544a| 中文字幕三级久久久久久| 末成年ASS浓精PICS| 从镜子里看我怎么c你| 色久综合网精品一区二区| 国产猛烈高潮尖叫视频免费|