생성적 적대 신경망(GAN) (Goodfellow et al., 2014)의 발전과 함께, 포즈 추정 분야에서도 혁신적인 접근법들이 등장했습니다.
Chen et al.(2017)은 인체 구조에 대한 사전 정보를 활용하기 위해 실제 포즈와 가짜 포즈를 구별하는 판별기를 설계했습니다.
Ning et al.(2017)은 학습된 투영을 사용하여 적절한 사전 정보를 부과함으로써 네트워크 학습 과정을 안내하는 외부 지식 탐색 방법을 제안했습니다.
Sun et al.(2017)은 인체 정규화와 사지 정규화라는 2단계 정규화 체계를 제시했습니다. 이는 상대적 관절 위치의 분포를 압축하여 합성곱 공간 모델의 학습을 용이하게 하고 포즈 추정의 정확도를 향상시켰습니다.
Marras et al.(2017)은 대략적 모델과 정제 모델 사이에 마르코프 랜덤 필드(MRF) 기반 공간 모델 네트워크를 도입하여 신체 관절의 상대적 위치에 대한 기하학적 제약을 적용했습니다.
포즈 주석 문제를 해결하기 위해 Liu and Ferrari(2017)는 포즈 추정을 위한 능동 학습 프레임워크를 제시했습니다. Ke et al.(2018)은 인간 포즈 추정을 위한 다중 스케일 구조 인식 네트워크를 제안했습니다.
Peng et al.(2018)은 데이터 증강과 네트워크 학습을 동시에 최적화하는 적대적 데이터 증강 방법을 제안했습니다. 주요 아이디어는 "어려운" 증강 작업을 온라인으로 생성하는 증강 네트워크(생성기)를 설계하여 목표 네트워크(판별기)와 경쟁시키는 것입니다.
Tang et al.(2018)은 인체의 구성을 학습하기 위해 심층 신경망을 활용하는 Deeply Learned Compositional Model을 포즈 추정에 도입했습니다.
Nie et al.(2018a)은 파싱 인코더와 포즈 모델 파라미터 어댑터를 포함하는 파싱 유도 학습기를 제안했습니다. 이는 공동 학습을 통해 포즈 모델의 동적 파라미터를 추정하여 더 정확한 포즈 추정을 위한 보완적인 유용한 특징을 추출합니다.
Nie et al.(2018b)는 인간 파싱과 포즈 추정을 하나의 프레임워크에서 공동으로 수행하는 방법을 제안했습니다. 이는 상호 보완적인 정보를 통합하여 더 강건하고 정확한 결과를 제공합니다.
Tang and Wu(2019)는 정보 공유 정도에 기반하여 관련 부위를 그룹화하는 데이터 기반 접근법을 제안했으며, 각 부위 그룹에 특화된 표현을 학습하는 부위 기반 분기 네트워크(PBN)를 도입했습니다.
포즈 추정 속도를 높이기 위해 Zhang et al.(2019)은 Fast Pose Distillation(FPD) 모델을 제시했습니다. 이 모델은 강건한 교사 네트워크의 포즈 구조 지식을 효과적으로 전달하여, 낮은 계산 비용으로 빠르게 실행할 수 있는 경량 포즈 신경망 아키텍처를 학습시킵니다.
이러한 다양한 접근법들은 포즈 추정의 정확도, 효율성, 그리고 견고성을 크게 향상시켰으며, 특히 GAN, 지식 증류, 다중 태스크 학습 등의 최신 기술을 포즈 추정 분야에 성공적으로 적용했습니다.