《數位之牆》【資策會】人工智慧深度強化學習 (台北6/27)

	回到首頁
		個人．家庭．數位化 - 數位之牆

關於本站

1996(2)

產業動態	【資策會】人工智慧深度強化學習 (台北6/27)

資策會	本新聞稿發佈於2019/03/27，由發布之企業承擔內容之立場與責任，與本站無關

本課程的目標在奠定學員學習當代人工智慧關鍵技術的理論基礎。透過學習許多目前具有代表性的深度學習神經網路架構，可累積學員對於各種重要神經網路元件的理解，進而組成許多人工智慧核心系統的設計，達成具有自我學習及解析功能的智慧型產品設計。

■ 發布／輪播新聞稿

新聞稿直達14萬電子報訂戶刊登新聞稿：按此

◆深度強化學習(Deep Reinforcement Learning)簡介
˙人工智慧環境(Environment)與智慧代理人(Agent)
˙策略與規劃(Policy and Planning)
˙價值函數(Value Function)
˙運作模型(Model)
˙酬勞與懲罰(Reward)
˙最優價值函數(Optimal Value Function)
˙馬可夫決策問題(MDP)

◆圖表化及逼近式 (Tabular and Approximation)解決方案
˙有限馬可夫決策處理(FMDP)
˙動態規劃(Dynamic Programming)
˙蒙地卡羅方法(Monte Carlo Method)
˙時間差分學習(Time-Difference Learning)
˙Q學習(Q-Learning)
˙策略梯度法(Policy Gradient Method)

◆類神經深度強化學習
˙深度Q學習網路(Deep Q-Learning Network)
˙TensorFlow DQN
˙OpenAI Gym
˙Actor Critic
˙Deep Deterministic Policy Gradients(DDPG)
˙Asynchronous Advantage Actor-Critic (A3C)
˙Distributed Proximal Policy Optimization (DPPO)

◆人工智慧深度強化學習個案研究
˙AlphaGo設計理念與方法
˙問答系統強化學習
˙汽車避撞系統模擬
˙自駕車強化學習
˙Q-learning Gridworld Player
˙Atari Ping Pong Player

詳細課程內容請參考以下網址：http://www.iiiedu.org.tw/ites/REF.htm

- 新聞稿有效日期，至2019/04/27為止

聯絡人　：張先生
聯絡電話：(02)6631-6539
電子郵件：alanchang@iii.org.tw

上一篇：安森美半導體-馬達驅動器模組方案套件圖形使用者介面(GUI)培訓教材
 下一篇：人工智慧工業自動檢測(AOI)與視覺辨識設計 (台北6/20)