学者分享| 麻省理工学院计算机科学博士分享最新机器技术的研究期刊论文

更新时间:2020-09-07




曾于2016年获得了哈佛大学计算机科学与数学学士学位的汤姆·银,现在就读麻省理工学院二年级计算机科学博士学位。在学习和智能系统小组以及计算认知科学小组的成员,NSF研究生奖学金和MIT总统奖学金的支持下创立了个人分享学习网站。


今天小编和大家分享他最新的文章有关机器学习(cs.LG);人工智能(cs.AI);机器人技术(cs.RO)领域的期刊论文:《因式MDP中学习特定于某些的》抽象以进行有效规划》


图片 2.png


摘要:


元计划或从经验中学到指导计划的方法,是一种改善计划的计算成本的有前途的方法。一般的元计划策略是学习对代理所考虑的状态和采取的措施施加约束。我们观察到(1)施加约束可以导致特定于上下文的独立性,从而使域的某些方面不相关;(2)代理可以通过将约束施加于自身行为来利用这一事实。这些观察结果使我们提出了特定于上下文的抽象马尔可夫决策过程(CAMP),这是对分解后的MDP的一种抽象,可以提供有效的计划。然后,我们描述如何学习施加约束,以便CAMP优化奖励和计算成本之间的权衡。我们的实验考虑了四个领域的五个计划者,包括可移动障碍物之间的机器人导航(NAMO),用于顺序操作的机器人任务和运动计划以及经典计划。我们发现,使用学习到的CAMP进行规划以始终优于基线,包括Stilman的NAMO特定算法。 

图片 3.png



关注公众号后台回复“最新”

即可领取全文pdf

计算机观察家.jpg

X