摘要:隨著我國(guó)航天技術(shù)的快速發(fā)展,包括導(dǎo)航、遙感和通信在內(nèi)的航天資源越來(lái)越豐富,同時(shí),國(guó)民經(jīng)濟(jì)和國(guó)防建設(shè)對(duì)航天信息的需求迫切,如何充分地應(yīng)用航天信息和航天資源,成為一個(gè)新的研究?jī)?nèi)容。分析了航天信息應(yīng)用的具體模式,采用深度強(qiáng)化學(xué)習(xí)的建模和優(yōu)化方法,探索和研究了具體應(yīng)用場(chǎng)景下的深度強(qiáng)化學(xué)習(xí)對(duì)應(yīng)用需求的籌劃和決策安排,從而在理論上驗(yàn)證了將人工智能方法應(yīng)用于航天信息綜合應(yīng)用決策的可行性,為航天信息應(yīng)用的大眾化、平民化提供了支撐。通過(guò)仿真環(huán)境,測(cè)試在有限迭代范圍內(nèi)多個(gè)模型的優(yōu)化速度。實(shí)驗(yàn)證明,在價(jià)值模型中選擇DoubleDQN網(wǎng)絡(luò),其優(yōu)化決策的收斂性能更好。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社
國(guó)際刊號(hào):2096-7586
國(guó)內(nèi)刊號(hào):42-1907/C