摘要:在基站无法提供通信支撑区域,可引入无人机群作为中继节点来搭建无人机应急通信网络。 针对无人机如何高效选择 最优中继节点及保证系统吞吐量最大化问题,提出一种基于 SA-SARSA 强化学习算法的无人机中继选择策略。 在所有的中继 节点通过解码重传(DF)之后进行转发,得到用户端最大比合并后的平均吞吐量的表达式,通过设定 SARSA 算法的状态、动作、 奖励函数,选择回报值最大的中继节点。 同时,引入退火算法来使源节点探索到更多的中继节点,从而使无人机群通信网络性 能达到最优状态。 仿真结果表明,与改进前的 SARSA 中继选择策略相比,所提的 SA-SARSA 中继选择策略占理想算法比例提 升 10%。 同时,在相同总功率条件下,所提策略所选的中继节点的吞吐量比 Q-learning 中继选择策略、SARSA 中继选择策略分 别提升了 8%、13%。