报告人:罗彪
报告题目:深度强化学习多目标决策
报告时间:2024年9月7日下午15:00-16:00
报告地点:电子信息工程学院320室
报告摘要:
深度强化学习凭借其强大的表征与学习能力,已被广泛应用于解决复杂的控制与决策问题。然而,许多决策任务涉及多个相互冲突的目标,使得标准强化学习方法在实用性、灵活性等方面均面临挑战。针对单智能体、多智能体多目标决策问题,我们提出了基于Pareto最优的多目标强化学习方法:PA2D-MORL与MO-MIX,得到高质量Pareto策略集。
个人简介:
罗彪,中南大学自动化学院教授、博士生导师、国家优青、湖南省科技新领军人才、湖南省杰青、IEEE Senior Member。近年来在IEEE TPAMI、Automatica、AAAI、IEEE TNNLS、IEEE TCYB、自动化学报等领域顶级学术期刊与会议上发表学术论文100余篇。2014-2018年在中国科学院自动化研究所任助理研究员、副研究员。现担任中国自动化学会(CAA)自适应动态规划与强化学习专业委员会副主任;现/曾担任国际期刊《IEEE Transactions on Neural Networks and Learning Systems》、《IEEE Transactions on Emerging Topics in Computational Intelligence》、《Artificial Intelligence Review》、《Neurocomputing》与《Journal of Industrial & Management Optimization》副主编;目前研究兴趣主要有:智能控制/决策/博弈、深度学习、强化学习。