五月四房婷婷-五月桃花网婷婷亚洲综合-五月天丁香花婷婷-五月天丁香色-天天射视频-天天射天

您當前的位置 :環(huán)球傳媒網>新視野 > 正文
厲害了!谷歌通過乒乓球運動強化機器人學習
2022-11-01 09:32:21 來源:DeepTech深科技 編輯:

乒乓球運動可大大助推機器人學習研究?

在最近的一篇博文中表示,機器人學習現(xiàn)已應用到許多真實世界任務,但將其應用于需要緊密循環(huán)的動態(tài)、高速人機交互任務還并不常見。這方面的任務可體現(xiàn)在乒乓球訓練上。

乒乓球任務有兩個互補的屬性,其不僅需要速度和精度(對算法要求高),還是高度結構化的(環(huán)境固定、可預測)。

另外,執(zhí)行乒乓球任務的機器人可與人和其他機器人分別對戰(zhàn),非常利于有關人機交互和強化學習方面的研究。因此,一些團隊已經開發(fā)了乒乓球研究平臺。

機器人團隊同樣搭建了一個類似平臺,使其能夠在多玩家、動態(tài)的環(huán)境中,研究機器人學習中出現(xiàn)的問題。

視頻 | (來源:)

對于該方面的研究,通過兩篇論文做了相關闡述,分別題為《i-Sim2Real:緊密人機交互循環(huán)中機器人策略的強化學習》()、《GoalsEye: 在一個物理機器人上學習高速精密乒乓球》(),且都已提交到 arXiv 上。

下面對的 i-Sim2Real 和 GoalsEye 兩個項目分別做一簡單介紹。

在 i-Sim2Real(i-S2R)項目中,機器人的目標本質上是有關合作的。即最大程度與人類玩家連續(xù)游戲。

由于在現(xiàn)實中通過人類訓練機器人既費時又費力,采用了一種基于仿真(模擬現(xiàn)實)的方法。但該方法較難準確模擬人類行為,尤其是在需要與人類進行緊密、閉環(huán)交互的任務上。

因此,開發(fā)出一種學習人類行為模型,專門用于人-機器人交互。最終,在與人對戰(zhàn)中,機器人能夠連續(xù)擊中乒乓球三百多次。

關于學習人類行為模型,其在官網 表示,該問題似乎是一個悖論。若起 初缺乏優(yōu)良的機器人策略,便很難獲得人機交互方面的優(yōu)質數(shù)據(jù)。但人類行為模型的缺失,又會得不到機器人策略。

為解決這個問題,i-S2R 以一般的人類行為模型為起點,并在模擬和真實訓練中不斷迭代,人類行為模型和策略都逐漸得到了優(yōu)化。

還通過不同的人類對手重復訓練,來評估 i-S2R。并將它與通常的模擬到現(xiàn)實(S2R,sim-to-real)+微調(FT,fine-tuning)進行比較,發(fā)現(xiàn) i-S2R 反彈長度比 S2R + FT 高約 9%。

i-S2R 和 S2R + FT 的反彈長度直方圖顯示,S2R + FT 的反彈大部分較短(即小于 5),而 i-S2R 實現(xiàn)更長的反彈更頻繁。

圖 | i-S2R 結果摘要(來源:)

還在博文中表示,i-S2R 專注于模擬到真實學習,但有時需要僅使用真實世界的數(shù)據(jù)進行學習。在這種情況下,縮小模擬到真實的差距是不必要的。

研究人員還簡單分析了模仿學習(Imitation learning,IL)和強化學習(Reinforcement Learning,RL)存在的問題。

其認為,IL 提供了一種簡易、穩(wěn)定的學習方法,但它需要獲得演示,并且?guī)缀醪粫^被模仿者的表現(xiàn)。而在高速環(huán)境下,收集專業(yè)人員訓練時的精確目標定位非常困難。

RL 雖然十分適合這種高速、高精度任務,但它面臨著一個艱難的探索問題(特別是在一開始),并且采樣效率很低下。

所以,在另外一個 GoalsEye 項目上,結合行為克隆技術,來塑造精確定位策略。該方法起始于一個結構薄弱的、非目標的小型數(shù)據(jù)集。其主要考慮乒乓球任務的精度。

關鍵詞: 谷歌通過乒乓球運動強化機器人學習 乒乓球運動強化機器人學習 乒乓球運動 機器人學習

分享到:
版權和免責申明

凡注有"環(huán)球傳媒網"或電頭為"環(huán)球傳媒網"的稿件,均為環(huán)球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環(huán)球傳媒網",并保留"環(huán)球傳媒網"的電頭。

Copyright ? 1999-2017 cqtimes.cn All Rights Reserved 環(huán)球傳媒網-重新發(fā)現(xiàn)生活版權所有 聯(lián)系郵箱:8553 591@qq.com
主站蜘蛛池模板: 亚洲免费视频在线 | 天天爽夜夜爽人人爽免费 | 亚洲第一a | 在线视频一二三区 | 日本大黄视频 | 欧美一级看片 | 在线观看国产麻豆 | 18视频在线观看网站 | 中文字幕 一区 婷婷 在线 | 看全色黄大色大片免费久久怂 | 亚洲最大在线观看 | 夜夜操女人 | 欧美精品中文 | 日本的黄色录像 | 在线观看国产一区二区三区99 | jk制服啪啪网站 | 国产国产成人精品久久 | 日本国产美国日韩欧美mv | 美女天天干 | 一a一级片 | 国产成人精品日本亚洲专区6 | 成人高清视频在线观看大全 | 翁熄系列乱老扒小雪小说 | 国产伦精品一区二区免费 | 天天摸天天做天天爽水多 | 不卡福利| 一级毛片日韩 | 欧美日韩亚洲国产 | 国产丝袜在线播放 | 欧美激情欧美狂野欧美精品免费 | 在线观看黄色毛片 | 色视频在线 | 国产手机在线αⅴ片无码观看 | 最近中文字幕国语完整视频 | 特黄视频| 91精品久久久久久久99蜜桃 | 亚洲精品第四页中文字幕 | 亚洲欧美日韩国产综合久 | 91精品视频免费在线观看 | 久久人人爽人人爽人人小说 | 日韩在线视频网址 |