be365体育平台、所2023年系列学术活动（第053场）：郭尚岐助理研究员清华大学精密仪器系

发表于： 2023-05-17 点击：

报告题目：基于因果推理的强化学习算法

报告人：郭尚岐清华大学精密仪器系助理研究员

所在单位：清华大学精密仪器系

报告时间：2023年5月22日星期一 10：00-11:00

报告地点：数学楼第二报告厅

校内联系人：孙维鹏 sunwp@jlu.edu.cn

报告摘要：在面对实际复杂问题时，强化学习通常面临部分观测的问题。为此，目前研究通常将历史观测序列引入到强化学习算法中，然而这导致状态空间随着历史长度增加而指数级增大。因果学习可以挖掘历史观测中的重要观测状态，讲历史序列进行压缩，从而降低历史观测空间的复杂度，提高基于历史观测的强化学习算法的效率。

报告人简介：

2011年9月-2015年6月，电子科技大学数理基础科学班，本科

2015年9月-2021年6月，清华大学自动化系，博士；

2021年12月至今，清华大学精密仪器系，博士后；

be365体育平台、所2023年系列学术活动（第053场）：郭尚岐 助理研究员 清华大学精密仪器系