|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区
您需要 登录 才可以下载或查看,没有账号?立即注册
×
摘要:本文研究了机器人足球赛中利用增强学习进行角色分工的问题,通过仿真试验和理论分析,指出文[1]中采取无限作用范围衰减奖励优化模型(infinite—horizon discounted model)的Q学习算法对该任务不合适,并用平均奖励模型(average—reward model)对算法进行了改进,实验表明改进后学习的收敛速度以及系统的性能都提高了近一倍。
PDF下载:
<ignore_js_op>
机器人足球赛中基于增强学习的任务分工.pdf
<em class="xg1">(373.53 KB, 下载次数: 0)
</em>
2010-3-3 14:48:13 上传
下载次数: 0
下载积分: 积分 -1
</ignore_js_op> |
|