小編原本也是一個懵懵懂懂

對 什麼事 AI 也不清楚的一個人

只知道 AI 是人工智慧

很多東西都可以利用人工智慧學習出來

剛開始也只是知道一些皮毛演算法

如: PSO 基因演算法 kalman filter

進到研究所後我學習到第一個 真的AI演算法

也是令我驚奇的一個演算法

Reinforcement Learning

讀者有興趣可以看看這本書

An introduction to Reinforcement Learning

Sutton 真的很厲害 也講得很好

幾乎現有做AI研究的 大概都是基於這本書

著名的 Google 學習打遊戲 學習下圍棋

也都是以 Reinforcement learning 為基礎加強而來

讀者有興趣的話 可以先實作出 Q-learning 出來

Q-learning 屬於 Reinforcement learning 的其中一種

是目前最為廣泛的演算法

Google 的 play Atari game 也是使用 Q-learning 演算法

 

 

 

關於Q learning 的相關知識可以參考這篇:http://mnemstudio.org/path-finding-q-learning-tutorial.htm

還有中文翻譯版本:http://blog.csdn.net/itplus/article/details/9361915

最簡單的就是利用 Q learning  寫出一個走迷宮程式

演算法慢慢學習 會漸漸學出最短路徑出來

我第一次跑出來的時候 真的覺得很驚奇~~~

 

但是傳統 Reinforcement learning 是用矩陣做運算

當狀態太多時 我們無法用矩陣去算 會算很久

而且可能算不出來 也沒有generalization(泛化)的功能

因此 google 將 傳統的矩陣算法 改成類神經

用類神經存取 傳統我們俗稱的 Q table 來進行運算

成功的解決傳統 Reinforcement learning 狀態太多的窘境

 

後來 google 還把他擴展 加上其他演算法

做出鼎鼎有名的 Alpha Go

比賽那幾天 小編可是全程觀看阿

都把研究拋在一邊了 哈哈

 

 

 

 

後來小編繼續追蹤 發現 DeepMind 也解決了 Robotic 控制的問題

不過用的是更高深的演算法 policy gradient

有興趣的可以去翻翻  裡面一堆數學阿~~

小編看的頭都暈了~~

 

運用此演算法 Google 成功地做出 讓演算法學習出把球踢進目標的機器人

 

 

 

 

最近小編又看到最新發展

google 已經做出讓機器手臂學習移動到目標點了

小編是在這個網站上看到的

他寫的文章 小編都覺得很棒

大家有空也可以去看看

最前沿:从虚拟到现实,迁移深度增强学习让机器人革命成为可能!

 

 

 

相信在不遠的將來

機器人就能走入每個人的家庭中了~

就像電腦進入家庭一樣

這就是小編目前追蹤的結果

如果有什麼最新發展小編會在告訴大家的~~

arrow
arrow
    文章標籤
    artificial intelligence
    全站熱搜

    Darwin的AI天地 發表在 痞客邦 留言(3) 人氣()