2019年11月2日 机器人实验室本周例会记录

强化学习报告

本周主题:时序差分算法

讲解人:张明昊

简要介绍:时间差分方法(TD)是强化学习中最核心的也是最新奇的方法,混合了动态规划(DP)和蒙特卡洛方法(MC),TD属于无模型方法,未知P和R,同时应用了采样和贝尔曼方程,可以从不完整的片段中学习,通过估计来更新估计

本周主题:基于抓取模型的Q-learning学习

讲解人:胡善智

简要介绍:Q-learning学习是一种基于表结构的学习方法,是一种比较易懂的强化学习方法,主要通过环境返回给智能体的奖励来学习,本次报告主要是使用抓取模型来演示Q-learning学习在实际应用中的作用。

项目进展报告

项目名称:WMS仓储信息系统

讲解人:张明昊

本周进展:

子项目:仓储系统WEB端

基础资料模块基本完成

储位管理模块基本完成

登录模块基本完成

子项目:仓储手持终端

仓储方面增加了商品确认功能

基本功能收尾

项目名称:室内导览

讲解人:容晋雄

本周进展:

  1. 人脸识别的移植
  2. 身体检测的移植
  3. 物体识别
  4. 小车倒车算法的仿真实现
  5. 基于雷达数据局部路径规划的实现

项目名称:Robocup仿真3D组

讲解人:高岩松

本周进展:

  1. 优化参数方面,测试了的行走,优化了转身。
  2. 行走引擎方面结束了spl中walkengine的部分。
  3. 完成了界外球和开球的决策。调研了角色分配算法。

项目名称:室内导览机器人(NAO 平台)

讲解人:胡善智

本周进展:

1. 测试了写字功能,调研了nao机器人电脑内部autoload.ini文件。

2. 编写了中文分词功能。

3. 对工程进行了异常处理,完成语音关机功能。

4. 学习了nao打高尔夫的视觉方面的知识。

5. 完成了天气人性化提醒测试。

老师最后对本次例会进行了点评,交代了关于纳新的事宜

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注