首頁(yè) > 期刊 > 無(wú)線電工程 > 基于深度強(qiáng)化學(xué)習(xí)的航天信息綜合應(yīng)用與決策研究【正文】

基于深度強(qiáng)化學(xué)習(xí)的航天信息綜合應(yīng)用與決策研究

深度強(qiáng)化學(xué)習(xí) 航天信息應(yīng)用 dqn 需求建模價(jià)值優(yōu)化

作者：王港; 帥通; 陳金勇; 高峰中國(guó)電子科技集團(tuán)公司航天信息應(yīng)用技術(shù)重點(diǎn)實(shí)驗(yàn)室; 河北石家莊050081

摘要：隨著我國(guó)航天技術(shù)的快速發(fā)展,包括導(dǎo)航、遙感和通信在內(nèi)的航天資源越來(lái)越豐富,同時(shí),國(guó)民經(jīng)濟(jì)和國(guó)防建設(shè)對(duì)航天信息的需求迫切,如何充分地應(yīng)用航天信息和航天資源,成為一個(gè)新的研究?jī)?nèi)容。分析了航天信息應(yīng)用的具體模式,采用深度強(qiáng)化學(xué)習(xí)的建模和優(yōu)化方法,探索和研究了具體應(yīng)用場(chǎng)景下的深度強(qiáng)化學(xué)習(xí)對(duì)應(yīng)用需求的籌劃和決策安排,從而在理論上驗(yàn)證了將人工智能方法應(yīng)用于航天信息綜合應(yīng)用決策的可行性,為航天信息應(yīng)用的大眾化、平民化提供了支撐。通過(guò)仿真環(huán)境,測(cè)試在有限迭代范圍內(nèi)多個(gè)模型的優(yōu)化速度。實(shí)驗(yàn)證明,在價(jià)值模型中選擇DoubleDQN網(wǎng)絡(luò),其優(yōu)化決策的收斂性能更好。

注：因版權(quán)方要求，不能公開(kāi)全文，如需全文，請(qǐng)咨詢(xún)雜志社

期刊咨詢(xún) 免費(fèi)咨詢(xún) 雜志訂閱

無(wú)線電工程

部級(jí)期刊下單

國(guó)際刊號(hào)：1003-3106

國(guó)內(nèi)刊號(hào)：13-1097/TN

雜志詳情

相關(guān)熱門(mén)期刊

湖北民族大學(xué)學(xué)報(bào)·哲學(xué)社會(huì)科學(xué)版

部級(jí)期刊下單

國(guó)際刊號(hào)：2096-7586

國(guó)內(nèi)刊號(hào)：42-1907/C
電腦迷

部級(jí)期刊下單

國(guó)際刊號(hào)：1672-528X

國(guó)內(nèi)刊號(hào)：50-1163/TP
馬克思主義與中華文化研究

部級(jí)期刊下單
讀寫(xiě)算

部級(jí)期刊下單

國(guó)際刊號(hào)：1002-7661

國(guó)內(nèi)刊號(hào)：42-1078/G4