强化学习报告
本周主题:时序差分算法
讲解人:张明昊
简要介绍:时间差分方法(TD)是强化学习中最核心的也是最新奇的方法,混合了动态规划(DP)和蒙特卡洛方法(MC),TD属于无模型方法,未知P和R,同时应用了采样和贝尔曼方程,可以从不完整的片段中学习,通过估计来更新估计

本周主题:基于抓取模型的Q-learning学习
讲解人:胡善智
简要介绍:Q-learning学习是一种基于表结构的学习方法,是一种比较易懂的强化学习方法,主要通过环境返回给智能体的奖励来学习,本次报告主要是使用抓取模型来演示Q-learning学习在实际应用中的作用。

项目进展报告
项目名称:WMS仓储信息系统
讲解人:张明昊
本周进展:
子项目:仓储系统WEB端
基础资料模块基本完成
储位管理模块基本完成
登录模块基本完成
子项目:仓储手持终端
仓储方面增加了商品确认功能
基本功能收尾

项目名称:室内导览
讲解人:容晋雄
本周进展:
- 人脸识别的移植
- 身体检测的移植
- 物体识别
- 小车倒车算法的仿真实现
- 基于雷达数据局部路径规划的实现

项目名称:Robocup仿真3D组
讲解人:高岩松
本周进展:
- 优化参数方面,测试了的行走,优化了转身。
- 行走引擎方面结束了spl中walkengine的部分。
- 完成了界外球和开球的决策。调研了角色分配算法。

项目名称:室内导览机器人(NAO 平台)
讲解人:胡善智
本周进展:
1. 测试了写字功能,调研了nao机器人电脑内部autoload.ini文件。
2. 编写了中文分词功能。
3. 对工程进行了异常处理,完成语音关机功能。
4. 学习了nao打高尔夫的视觉方面的知识。
5. 完成了天气人性化提醒测试。

老师最后对本次例会进行了点评,交代了关于纳新的事宜

