최근 인간 자세 분석 기술이 연구 분야와 산업 현장에서 큰 주목을 받고 있습니다. 이는 게임, 영상 감시 시스템, 스포츠 퍼포먼스 분석, 인간-컴퓨터 상호작용 등 다양한 분야에서의 활용도가 높아지고 있기 때문입니다. 특히 딥러닝 기술의 발전으로 자세 추정 정확도가 크게 향상되어, 자세 기반 응용 프로그램의 실용성이 더욱 증대되고 있습니다.
이 글에서는 딥러닝을 활용한 자세 기반 응용 프로그램에 대해 포괄적으로 살펴보고자 합니다. 주요 주제는 자세 추정, 자세 추적, 그리고 동작 인식입니다.
자세 추정 기술은 이미지나 영상 시퀀스에서 인체 관절의 위치를 정확히 파악하는 것을 목표로 합니다. 자세 추적은 이보다 진보된 기술로, 시간에 따른 일관된 인체 자세 궤적을 생성하는 것에 초점을 맞춥니다. 동작 인식은 이러한 자세 추정 또는 추적 데이터를 기반으로 특정 동작의 유형을 식별하는 기술입니다. 이 세 가지 기술은 서로 밀접하게 연관되어 있으며, 후자의 기술이 전자의 기술에 의존하는 경우가 많습니다.
한편 또 다른 면에서는 단일 인물 자세 추정에서 다중 인물 자세 추정으로의 발전, 2D 자세 추정에서 3D 자세 추정으로의 진화, 정지 영상에서 동영상으로의 확장, 시간적 맥락을 점진적으로 활용하는 방법에서 자세 추적으로의 발전, 그리고 최종적으로 자세 기반 동작 인식까지 폭넓게 연구되고 있습니다.
딥러닝을 자세 분석에 적용한 사례를 중심으로 살펴보면서, 앞으로 각 기술의 장단점을 객관적으로 분석하고자 합니다. 특히 비디오 내에서 앞서 언급한 세 가지 작업을 어떻게 통합된 프레임워크로 구현하는지에 대해 알아보겠습니다.
그림출처 :Song(2017) An End-to-End Spatio-Temporal Attention Model for Human Action Recognition from Skeleton Data