Google建立了一所機械人幼稚園

Google和一些Alphabet的子公司的研究員指出,機械人透過共享學習經驗,可更快學會執行一些簡單任務。

研究人員正以「增強學習技術」(Reinforcement Learning)的方式、結合反覆試驗、失誤和正面反饋,來訓練工業機器人執行簡單任務。

目前,他們教授機器人的任務還是非常簡單(如開門和輕推物件)。在不久將來,機器人或可處理日常瑣事(如摺衣服和洗碗)。

機械人變得愈來愈價廉物美。可是,要透過編程(Programming),令它們可在充滿未知因素的日常環境穩定地執行任務,是近乎不可能的事。

增強學習技術,或可提供一個解決方案,讓機械人在工作學習中為自己編程。然而,要一個機械人在過程中反覆嘗試無數方法,將會非常耗時。於是,學者正研究一種雲端技術,透過機械人共享學習,大大節省機械人反覆試驗的時間。可是,這種技術仍是停留發展初段。

最近,Google的研究團隊詳述了一些讓機械人共享學習的策略。在每一種情況,正進行學習的機械人,會用它們的人工神經網絡(Neural Network),預測不同的動作的結果。每個機械人的行為表現,都會有些微不同,差異會漸漸強化。機械人們的神經網絡,會定期匯報給一個中央伺服器;該中央伺服器,會為機械人建立一個結合不同機械人學習成果的全新神經網絡,再重新輸入到每個機械人,以進行下一輪訓練。

在第一輪實驗,機械人要轉動門柄開門。四部機械人各自開啟一道不同設計的門。它們共享學習經驗以後,在實驗最後一環,儘管機械人們要開啟一道四部機械人也從未遇過的門,機械人們都成功完成任務。

在第二輪實驗,機械人們與一個人為控制的機械臂進行互動,它們的學習進展大大加快了。在第三輪實驗,機械人透過攝像機輸入的資料,學會移動和旋轉物件,以及預測不同行動會如何改變攝像機傳來的圖像。

美國布朗大學助理教授Stefanie Tellex一直研究機械人學習,她指Google的實驗令人振奮:

「讓機械人預測不同動作物理效果,可使它們理解我們世界如何運作。」

透過機器學習技術,Google團隊正研究更多革命性的機械人應用。現在,已有不少機械人生產商研究如何運用增強學習技術,精簡產品的編程工序。現階段,機械人所能學到的還是很有限。但隨著算術改善,機械人應用更廣泛,在未來會更能幫助我們的日常生活。

 

來源:MIT Technology Review

You may also like...