This research proposes a novel control policy learning method for a quadruped robot using a Single Rigid Body model pre-training and a leg mass curriculum. This approach enables the smoother discovery of dynamic movements by performing pre-training in a simulation environment where the actual robot’s model is approximated as a Single Rigid Body. This helps avoid challenges such as leg collisions and foot slipping that may arise during dynamic movements. The learned control policy is then translated into a feasible control policy for the real robot by continuously retrieving leg mass through a leg mass curriculum method. By learning locomotions and dynamic jumping motions in the simulation environment, it has been demonstrated that pre-training in a Single Rigid Body model is effective in finding the desired dynamic movements. It has also been demonstrated that the leg mass curriculum can effectively adapt the control policies found in the Single Rigid Body model to the actual robot model.
이 연구에서는 족형 로봇의 새로운 제어정책 학습법으로서, 단일 강체 모델의 예비 학습과 다리 질량 커리 큘럼을 활용하는 방법을 제안한다. 이 접근법은 실제 로봇의 모델을 단일 강체 모델로 근사한 시뮬레이션 환경에서 예비 학습을 수행함으로써 동작을 수행하는 데 직면할 수 있는 다리간 충돌, 미끄러짐 등의 어려 움들을 피해 동적인 움직임을 보다 원활하게 찾아낼 수 있다. 이러한 제어 움직임은 실제 로봇과 동일할 때까지 다리 질량을 연속적으로 증가시키는 다리 질량 커리큘럼 방법을 통해 실제 로봇에서 사용 가능한 제어 정책으로 변환된다. 시뮬레이션 환경에서 기본적인 보행 동작과 동적인 점프 동작을 통해 단일 강체 모델에서의 예비 학습이 원하는 동적 움직임을 효과적으로 찾아내는 데 기여하며, 다리 질량 커리큘럼이 단일 강체 모델에서 발견한 제어 정책을 효과적으로 실제 로봇 모델에 맞게 변환할 수 있음을 입증하였다.