一種動態環境下空間機器人的快速路徑規劃方法
摘要:針對動態環境下空間機器人采用深度強化學習進行路徑規劃時存在的收斂速度慢問題,采用遷移學習算法設計了一種適應動態環境的快速路徑規劃器.首先,綜合考慮空間機器人運動過程中存在的避障、時間和擾動約束,在靜態環境下對深度神經網絡進行預訓練.其次,將上述訓練后的權值作為動態環境下深度神經網絡的初始權值,再經過動態環境下的訓練進行參數微調.最后,以平面五自由度空間機器人為例對所設計的方法進行了驗證,并與直接訓練方法進行了比較.實驗結果表明,該方法能夠將訓練收斂時間從1033回合縮短到450回合,在保證規劃路徑準確率的前提下,提高訓練的收斂速度.
注: 保護知識產權,如需閱讀全文請聯系空間控制技術與應用雜志社