数学交叉科学研究所学术报告(Luigi Glielmo教授,意大利那不勒斯费德里科二世大学)
来源:系统管理员 发布时间:2024-10-21
报告题目:复杂网络动力学和控制优化的强化学习方法
报告人:Luigi Glielmo教授,意大利那不勒斯费德里科二世大学
报告时间及地点:
日期 | 时间 | 地点 | 报告主题 |
2024年10月22日(周二) | 9:00-11:00 | 20-308 | 凸优化I |
13:30-15:30 | 20-308 | ||
2024年10月23日(周三) | 9:00-11:00 | 16-335 | 凸优化II 马尔科夫链 动态规划 |
13:30-15:30 | 16-231 | ||
2024年10月28日(周一) | 9:00-11:00 | 16-113 | 强化学习 |
13:30-15:30 | 16-226 | ||
2024年10月29日(周二) | 9:00-11:00 | 20-308 | 强化学习的应用 |
13:30-15:30 | 20-308 |
摘要:决策问题普遍存在于生产生活中,因此不同领域都对其进行了研究,通常是为了设计出能够得到最佳决策的正式程序。强化学习就是这样的方法之一,它既可以被看作一种机器学习方法,也可以被看作一种最优控制方法。强化学习是一种基于采样的方法,用于解决马尔可夫决策过程(MDPs),即当智能体(agent)在当前情况(state)和所选决策(action)下获得奖励时,由于当前动作影响未来状态,进而影响未来奖励,因此该问题的研究是有意义的。事实证明,强化学习是一种非常成功的技术。在本课程中,我们将探讨强化学习控制网络的最新趋势,从凸优化的基本概念开始,我们通过动态规划转向无模型强化学习。
报告人简介:Luigi Glielmo,意大利不勒斯费德里科二世大学教授,IEEE senior member,SIAM member。主要研究方向:奇异摄动方法、模型预测控制方法、汽车系统控制、脑深部刺激建模与控制、智能电网控制、卫星自主性、真核细胞中蛋白质运输的建模和布尔控制网络。最近的研究聚焦于:能源社区管理和锂离子电池的健康状态估计,与意大利公司合作。在国际期刊或国际会议论文集上发表近220篇论文,出版专著2部,并拥有2项专利。担任IEEE Control Systems Letters和IEEE Transaction on Automatic Control(前)编辑委员会成员、IEEE Control Systems Society Technical Committee on Automotive Controls共同提案人和主席、 IFAC会议委员会副主席,国际自动控制联合会(2023-2026)和2019年欧洲控制会议(那不勒斯,2019年6月)的总联合主席。
邀请人:刘洋