一種動(dòng)態(tài)環(huán)境下空間機(jī)器人的快速路徑規(guī)劃方法
摘要:針對(duì)動(dòng)態(tài)環(huán)境下空間機(jī)器人采用深度強(qiáng)化學(xué)習(xí)進(jìn)行路徑規(guī)劃時(shí)存在的收斂速度慢問題,采用遷移學(xué)習(xí)算法設(shè)計(jì)了一種適應(yīng)動(dòng)態(tài)環(huán)境的快速路徑規(guī)劃器.首先,綜合考慮空間機(jī)器人運(yùn)動(dòng)過程中存在的避障、時(shí)間和擾動(dòng)約束,在靜態(tài)環(huán)境下對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練.其次,將上述訓(xùn)練后的權(quán)值作為動(dòng)態(tài)環(huán)境下深度神經(jīng)網(wǎng)絡(luò)的初始權(quán)值,再經(jīng)過動(dòng)態(tài)環(huán)境下的訓(xùn)練進(jìn)行參數(shù)微調(diào).最后,以平面五自由度空間機(jī)器人為例對(duì)所設(shè)計(jì)的方法進(jìn)行了驗(yàn)證,并與直接訓(xùn)練方法進(jìn)行了比較.實(shí)驗(yàn)結(jié)果表明,該方法能夠?qū)⒂?xùn)練收斂時(shí)間從1033回合縮短到450回合,在保證規(guī)劃路徑準(zhǔn)確率的前提下,提高訓(xùn)練的收斂速度.
注: 保護(hù)知識(shí)產(chǎn)權(quán),如需閱讀全文請(qǐng)聯(lián)系空間控制技術(shù)與應(yīng)用雜志社
.jpg)
展.jpg)


技術(shù).jpg)
與應(yīng)用.jpg)
于我們.jpeg)