小編原本也是一個懵懵懂懂
對 什麼事 AI 也不清楚的一個人
只知道 AI 是人工智慧
很多東西都可以利用人工智慧學習出來
剛開始也只是知道一些皮毛演算法
如: PSO 基因演算法 kalman filter
進到研究所後我學習到第一個 真的AI演算法
也是令我驚奇的一個演算法
Reinforcement Learning
讀者有興趣可以看看這本書
An introduction to Reinforcement Learning
Sutton 真的很厲害 也講得很好
幾乎現有做AI研究的 大概都是基於這本書
著名的 Google 學習打遊戲 學習下圍棋
也都是以 Reinforcement learning 為基礎加強而來
讀者有興趣的話 可以先實作出 Q-learning 出來
Q-learning 屬於 Reinforcement learning 的其中一種
是目前最為廣泛的演算法
Google 的 play Atari game 也是使用 Q-learning 演算法
關於Q learning 的相關知識可以參考這篇:http://mnemstudio.org/path-finding-q-learning-tutorial.htm
還有中文翻譯版本:http://blog.csdn.net/itplus/article/details/9361915
最簡單的就是利用 Q learning 寫出一個走迷宮程式
演算法慢慢學習 會漸漸學出最短路徑出來
我第一次跑出來的時候 真的覺得很驚奇~~~
但是傳統 Reinforcement learning 是用矩陣做運算
當狀態太多時 我們無法用矩陣去算 會算很久
而且可能算不出來 也沒有generalization(泛化)的功能
因此 google 將 傳統的矩陣算法 改成類神經
用類神經存取 傳統我們俗稱的 Q table 來進行運算
成功的解決傳統 Reinforcement learning 狀態太多的窘境
後來 google 還把他擴展 加上其他演算法
做出鼎鼎有名的 Alpha Go
比賽那幾天 小編可是全程觀看阿
都把研究拋在一邊了 哈哈
後來小編繼續追蹤 發現 DeepMind 也解決了 Robotic 控制的問題
不過用的是更高深的演算法 policy gradient
有興趣的可以去翻翻 裡面一堆數學阿~~
小編看的頭都暈了~~
運用此演算法 Google 成功地做出 讓演算法學習出把球踢進目標的機器人
最近小編又看到最新發展
google 已經做出讓機器手臂學習移動到目標點了
小編是在這個網站上看到的
他寫的文章 小編都覺得很棒
大家有空也可以去看看
最前沿:从虚拟到现实,迁移深度增强学习让机器人革命成为可能!
相信在不遠的將來
機器人就能走入每個人的家庭中了~
就像電腦進入家庭一樣
這就是小編目前追蹤的結果
如果有什麼最新發展小編會在告訴大家的~~
留言列表