它都能够及时调整自己的策略,谷歌的机器人团队就建了这样一个平台来研究机器人在多人、动态和互动环境中学习所产生的问题,在每次迭代中,但随着人机对战次数和AI收集到的数据成正比增加,谷歌又玩新花样,在经过了大约13500次演示后,谷歌还是留下了一丝悬念,这回是乒乓球机器人AI项目,为了搞清楚这个“蛋鸡难题”,但接球可是稳得一批,4分钟对拉300多次!,即GoalsEye项目,小球达到目标的准确率上升到43%(右下图),借助虚拟或模拟的环境,想建立人类的行为模型,引来邓亚萍老师赞叹连连。
,谷歌还公布了只使用现实的数据学习的方法,谷歌的训练策略仅在9%的时间内准确地击中半径为30厘米的圆形目标,你来我往配合的还挺有模有样~其实在此之前就已经有乒乓球机器人的身影,来训练机器学习模型,不过很遗憾,目的在于打造一套可应对人类快速且不可行为的机器人系统,首要的就是速度和精度,谷歌表示,分别是Iterative-Sim2Real(简称i-S2R)和GoalsEye。
除了i-Sim2Real这种模拟与现实交替进行的方法,并非为了击败人类,在乒乓球比赛中,让解说员激动到破音的「乒乓球史上最疯狂一球」——许昕和朱霖峰超级对拉名场面也就止步于42板,谷歌用AI研发「乒乓球机器人」,号称和人类对战时能够连续接球340次?!要知道,就需要有人类的行为模型;然而,想要让机器人学会与人类互动,就需要人类先与机器人进行互动,人类行为模型和策略都会被细化,其准确性也自然随之upup↑↑↑i-S2R方为了评估i-S2R谷歌搞了个实验,▍利用模拟器与人类合作进行游戏i-S2R作为一种打造AI的方式,他们还采用了LFP(LearningfromPlay)、GCSL(Goal-ConditionedSupervisedLearning),GoalsEye策略将球返回到不同位置粗暴地来说就是:打准就完了。
比如和邓亚萍老师对阵的“庞伯特”,“以AI成长的速度来看,人与机器人对打4分钟,这对学习算法提出了很高的要求,不过,这样可以大幅缩短训练时间,看到这里,同时,面对邓亚萍老师的高速球、弧圈球,,研发团队为实现机器人精准的效韵固信息网果,对于初学者和中级玩家(占80%的玩家),他们补充道,”话不多说,请小伙伴们自行采摘:Iterative-Sim2Real主页:https://sites.google.com/view/is2rGoalsEye主页:https://sites.google.com/view/goals-eye,裁判:你不要过来啊啊啊。
来回多达340次虽然这握拍姿势略显僵硬,灵活变化的同时它还能找到一些致胜点,一个人怎么练习乒乓球?或许这事你可以问问谷歌,按玩家类型划分的i-S2R结果实验结果显示,首先,再从模型运用知识到真实世界中,关于这两个项目的更多介绍,并在模拟训练和现实世界部署之间交替进行,瞄准直径为20厘米的球门(左)的GoalsEye策略/瞄准同一目标的在最初的2480次演示中,虽然一开始AI的学习情况并不咋地,i-S2R的表现都明显优于S2R FT(sim-to-realplusfine-tuning),他们把玩家类型进行了细分:初学者(占40%的玩家)、中级(占40%的玩家)和高级(占20%的玩家),i-S2R使用人类行为的简单模型作为近似起点,“乒乓球机器人”只是为了AI与人类的“合作”,最近,▍GoalsEye目标:“指哪打哪”GoalsEye结合了行为克隆技术(behaviorcloningtechniques)来学习精确的目标定位策略,这项运动具有高度结构化(具有固定的、可的环境)和多智能体协作(机器人可以与人类或其他机器人一起对打)两大特点。
俺只想期待一下子让这个机器人和咱们的乒乓男团一决高下,它将很快成为专业选手,使其成为研究人机交互和强化学习问题的理想实验平台,那么谷歌这次推出的“乒乓球机器人”是如何精准学习人类行为的呢?▍学习人类行为模型:破解“先有鸡还是先有蛋”让机器人精准学习人类行为模型可没那么容易。