本課程學員將學習到如何使用RHadoop 分析巨量資料及架設分析應用等關鍵技術,學習該如何結合R 與Hadoop Eco System,打造巨量資料分析系統,藉由實作分析應用,讓學員更加了解如何透過RHadoop進行大量資料的處理、分析與應用。 資策會「巨量資料分析-使用RHadoop」將於2015年6月6日開辦,相關資訊請參閱課程網頁,或電(02)6631-6533,黃小姐。
課程大綱: 1. 巨量資料分析基礎 (1) 什麼是巨量資料? (2) 資料科學家應扮演的角色 (3) 資料分析的案例 2. Hadoop Eco System簡介 (1) 使用HDFS分散式儲存資料 (2) 使用MapReduce 進行平行運算 (3) 使用Sqoop 與Flume 擷取資料 (4) 使用Oozie 管理工作 3. R 資料分析 (1) 為什麼使用R語言? (2) R語言基礎 (3) 使用Plyr 套件完成簡單資料分析 (4) 使用R完成資料探索 4. RHadoop 元件簡介 (1) RHadoop 簡介 (2) 資料序列化與資料交換- 使用ravro (3) 操作 HDFS – 使用rhdfs (4) 操作hbase – 使用rhbase (5) 操作 MapReduce – 使用rmr2 5. R MapReduce 簡介與實作 (1) Hello World- 使用rmr2 撰寫MapReduce 版的Word Count (2) 使用rmr2 實做巨量資料統計 (3) 使用rmr2 實作表格連結 (table join) 6. RHadoop 與巨量資料分析 (1) 使用plyrmr 實作資料分析 (2) 使用rmr2 實作迴歸分析 (3) 使用rmr2 實作分群演算法 (4) 使用rmr2 實作分類演算法 7. 推薦系統實作 (1) 簡介推薦演算法 Collaborative Filtering (2) 使用R 實作推薦演算法 (3) 使用RHadoop 實作推薦演算法 (4) 串接Hadoop Eco System 元件與RHadoop 建構及時推薦系統 詳細資訊請參考課程網址:http://www.iiiedu.org.tw/ites/RHADOOP.htm
- 新聞稿有效日期,至2015/06/05為止
聯絡人 :黃小姐 聯絡電話:(02)6631-6533 電子郵件:julie620@iii.org.tw
上一篇:資策會「物聯網工程師(EPCIE)國際認證班」(台北5/29)
下一篇:資策會「Spark巨量資料分析實務班」(台北5/30)
|
■ 我在中國工作的日子(十四)阿里巴巴敢給股票 - 2023/07/02 ■ 我在中國工作的日子(十三)上億會員怎麼管理 - 2023/06/25 ■ 我在中國工作的日子(十二)最好的公司支付寶 - 2023/06/18 ■ 我在中國工作的日子(十一)兩個女人一個男人 - 2023/06/11 ■ 我在中國工作的日子(十)千團大戰影音帶貨 - 2023/06/04 ■ 我在中國工作的日子(九)電視購物轉型電商 - 2023/05/28 ■ 我在中國工作的日子(八)那些從台灣來的人 - 2023/05/21 ■ 我在中國工作的日子(七)嘉丰資本擦身而過 - 2023/05/14 ■ 我在中國工作的日子(六)跟阿福有關的人們 - 2023/05/07
|