西安建筑科技大学 信息与控制工程学院
TU995;TP273
“十三五”国家重点研发计划(编号:2017YFC0704207)资助 ]自适应学习率方法。训练出当前状态下最优的PID增益后,根据式(2)~式(7)计算出控制量,在控制量作用后再观察新状态下的流量和室温,比较前后时刻状态获得奖励,并继续进行训练学习,不断通过观察状态训练Q表,得出每个状态下的PID增益以控制阀门开度改变环境状态。故结合Q学习PID控制算法的伪代码如算法2所示
段中兴,赵莎,马祥双.基于Q学习的供热末端自适应PID控制算法计算机测量与控制[J].,2020,28(6):80-85.
复制