
基于多步回溯Q(λ)学习算法的多目标最优潮流计算余涛􀀁 胡细兵􀀁 刘靖(华南理工电力学院, 广东广州510640)摘􀀁 要: 为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点, 提出了一种基于半马尔可夫决策过程的多步Q ( 􀀁)学习算法, 该算法不依赖于对象模型, 将最优潮流问题中的约束、动作和目标转换成算法中的状态、动作与奖励, 通过不断的试错、回溯、迭代来动态寻找最优的动作. 将该算法在多个IEEE 标准算例中与其他算法进行比较, 取得了良好的效果, 验证了多步Q ( 􀀁)学习算法在处理多目标最优潮流问题时的可行性和有效性.关键词: 电力系统; 最优潮流; Q ( 􀀁 )学习算法; 多目
Copyright©2025 多多文库
违法及侵权内容举报邮箱:zh@ddwenku.com