2019年11月2日机器人实验室本周例会记录

本周主题：时序差分算法

讲解人：张明昊

简要介绍：时间差分方法(TD)是强化学习中最核心的也是最新奇的方法，混合了动态规划(DP)和蒙特卡洛方法(MC)，TD属于无模型方法，未知P和R，同时应用了采样和贝尔曼方程，可以从不完整的片段中学习，通过估计来更新估计

本周主题：基于抓取模型的Q-learning学习

讲解人：胡善智

简要介绍：Q-learning学习是一种基于表结构的学习方法，是一种比较易懂的强化学习方法，主要通过环境返回给智能体的奖励来学习，本次报告主要是使用抓取模型来演示Q-learning学习在实际应用中的作用。

项目名称：WMS仓储信息系统

讲解人：张明昊

本周进展：

子项目：仓储系统WEB端

基础资料模块基本完成

储位管理模块基本完成

登录模块基本完成

子项目：仓储手持终端

仓储方面增加了商品确认功能

基本功能收尾

项目名称：室内导览

讲解人：容晋雄

本周进展：

项目名称：Robocup仿真3D组

讲解人：高岩松

本周进展：

项目名称：室内导览机器人(NAO 平台)

讲解人：胡善智

本周进展：

1. 测试了写字功能，调研了nao机器人电脑内部autoload.ini文件。

2. 编写了中文分词功能。

3. 对工程进行了异常处理，完成语音关机功能。

4. 学习了nao打高尔夫的视觉方面的知识。

5. 完成了天气人性化提醒测试。

老师最后对本次例会进行了点评，交代了关于纳新的事宜

留下评论