단안 비디오로부터의 다수 휴먼 객체 추적 연구는 딥 러닝의 발전과 함께 주목을 받으며 크게 발전해 왔다. 본 연구에서 우리는 휴먼 객체의 외관 변화를 고려한 2 단계의 3 차원 표현 기반 다수 휴먼 객체 추적 알고리즘을 제안한다. 기존의 다수 휴먼 객체 추적 모델은 사람에 대한 검출 영역 내의 외관 변화에 따라 추적 성능이 크게 저하되는 문제점을 가진다. 이를 해소하기 위해, 제안하는 방법은 외관 변화 정도에 따라 검출 이후의 추적 과정을 나누고 각 단계 별 최적의 유사도를 사용하여 휴먼 객체를 추적한다. 실험을 통해 우리는 여러 데이터셋에 대해 제안하는 방법이 기존 모델들에 비해 우수한 추적 성능을 달성함을 보인다.