哈尔滨理工大学学士学位论文- I -基于自注意力机制的空战决策算法研究摘要针对现代空战高动态、强对抗与非完全信息博弈特性,传统无人机突防决策方法存在环境适应性差、规则依赖度高、高维态势特征提取能力不足的瓶颈,传统深度强化学习网络也存在权重静态化、特征感知模糊、决策不可解释等缺陷。为此,本文以一对一突防对抗为场景,提出融合自注意力机制与近端策略优化的 Attention-PPO 智能决策算法。针对商用仿真环境算力开销大、接口复杂、难以支撑强化学习高效训练的问题,本文自主构建轻量化、高保真三维突防对抗仿真环境,集成连续运动学模型与比例导引拦截逻...
发表评论取消回复