-
2021년 연구실 연구 과제로 진행했던 비가시영역영상복원 연구 과정을 미팅 자료를 통해 돌아보았다.
* 현재 진행 중인 과제 + 개인적인 기록이므로 자세한 설명은 생략하였다.
1월, 2월 : Transformer 모델을 비가시 영역 탐지에 적용하였다. 3월 : ResNet 모델을 사용하지 않고 pure transformer를 통해 학습해보고자 하였으나, 성능이 나오지 않아 tokens-to-token 모듈을 도입하였다. 4월 : t2t-vit 모델 + 1x1 신호를 통한 자세 추정 결과를 기반으로 kcc2021에 논문 제출, 우수 논문 수상 5월, 6월 : segmentation 연구 시작, YOLACT 모델을 도입하고자 하였으나 학습이 잘 되지 않았으며, Anchor 기반 모델은 신호에는 적합하지 않아서 학습이 잘 안되는게 아닌가 추측하였다. 7월 : Anchor 방식이 아닌, 기존에 사용한 end-to-end 방식을 사용하면 segmentation도 된다는 사실을 확인하였고, 이 결과를 바탕으로 end-to-end object detection 모델인 detr 모델을 적용, 사람 1명 + 물체에 대한 탐지에 성공하였다. 8월 : 기존 데이터 셋에 대해 일정 수준 이상 학습이 됨을 확인했으므로, 다양한 위치 + 1명 이상의 사람 + 다양한 물체의 탐지 결과를 확인하기 위하여 새로 데이터 수집을 진행하였다. 새로 수집한 데이터셋에 대해서는 학습 결과가 좋지 못했다. 9월 : 상반기에 작성한 논문에 segmentation 결과를 추가하여 정보과학회 저널에 논문을 투고하였으며, 연구실 세미나에서 detr에 대해 발표하였다. 10월, 11월 : 1D convolution 기반 backbone, ewma를 통한 신호 전처리를 통해 학습에 성공하였으며, back of freebies 논문을 참고해 최신 object detection 기법들을 도입해 추가로 성능을 소폭 향상 시켰다. 11월 계속 : 성능을 더욱 향상시키기 위해 모델을 꾸준히 개발하였으며 box 탐지 성능을 AP@50 기준 0.11->0.60까지 향상시켰다. 12월 : 과제 연차 보고서 작성을 진행하였으며, 사용 중인 모델에 대한 분석 + simdr 기반 pose estimation 모듈을 추가하여 pose estimation을 진행하고 있으며, 성능 향상 방안을 고민 중에 있다.
댓글