128日上午,由研究生院/研究生工作部主办、运输工程学院承办、校研究生科学技术协会协办的“虹”学讲堂第528讲在南校区东院伯声报告厅顺利举办。此次讲座特邀了西北工业大学周琛淏教授作题为“竞合模式下的水平运输充电与作业调度”的报告,共计200余名师生参加。

周琛淏教授作报告

本次报告主要围绕基于多智能体强化学习的水平运输充电与作业调度优化、基于多智能体构架的水平运输在线路径优化与仿真2个方面展开。周琛淏教授提出了自动导引车(AGV)任务分配的多智能体Q学习模型,将每一个学习智能体与一台AGV关联,通过智能体之间的信息交互,每个智能体的学习过程更加依赖与其相邻的智能体,实现了既竞争又合作以及集中训练和分散执行的模式。他构建了随机速度下的车辆充电与作业调度问题的马尔科夫决策过程模型,根据问题特征设计了状态、动作、智能体观测、状态转移函数与奖励函数,从而表征车辆和环境之间的动态交互过程。他提出了基于演员-评论家框架的多智能体深度强化学习算法,克服了状态空间巨大等问题,并且使训练好的模型能用于集装箱码头不同规模的水平运输充电与作业调度实时求解。此外,针对在线路径优化,他提出了两阶段在线算法,先是动态线路规划算法,而后是动态集群划分算法和无死锁轨迹规划算法;进而,结合实际搭建了仿真平台,通过仿真实验证明该算法能够在大型复杂网络交通中科学高效地规划车辆路径,解决了大规模无死锁车辆路径规划,验证了该算法落地应用的可行性。

活动现场照片

报告结束后,周琛淏教授耐心回答了老师和同学们的问题,使大家对竞合模式下的水平运输充电与作业调度有了更为深入的了解。

                                                                                                         供稿:马聪  初审:石白茜 终审:葛颖恩