인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술대회자료
- 저자정보
- 발행연도
- 2023.6
- 수록면
- 488 - 491 (4page)
이용수
초록· 키워드
최근 Deep Learning Computer Vision 분야는 인간의 능력을 뛰어넘는 능력들을 보여주고, 다양한 분야의 영상처리에서 유용하게 사용되고 있다. Computer Vision의 한 분야로 Single image super resolution(SISR)이 있다. 이는 단일 이미지를 x2, x3, x4, x8 등의 Upscale 하여 저해상도의 이미지를 고해상도의 이미지로 재구성해준다. 위의 기술은 열화상 영상을 만들기 위한 적외선 센서의 비용적, 성능적 한계로 인해 주로 다루어지는 저해상도의 열화상 영상 데이터를 다양한 곳에 활용 가능하도록 고해상도 이미지로 변환하기에 굉장히 유용하다.
이에 본 논문은 다양한 Super resolution 모델들의 성능을 비교 분석한다. 모델의 종류로는 Deep convolution neural network(심층 합성곱 신경망)를 기본 구조로 이루어진 SRCNN [1]. 이를 기반으로 이미지 생성 모델인 적대적 신경망(GAN, Generative adversarial network)모델인 SRGAN [2]이 발전한 Real-ESRGAN [3] 그리고 트랜스포머(Transformer) 기반의 SwinIR [4], HAT [5] 등이 있다. 위 모델들의 육안으로 보이는 성능, 모델의 무게를 나타내는 파라미터의 수, 모델을 학습하는데 걸리는 시간 과 학습된 모델이 테스트 이미지를 처리하는 시간을 비교 분석한다.
또한 Real-ESRGAN 모델에 Thermal dog and people dataset을 fine-tuning하여 열화상(Thermal, Infrared) 데이터를 입력 데이터로 필요로 하는 분야에 기존 사전학습 모델보다 뛰어난 열화상 사전학습 모델을 제안한다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지이에 본 논문은 다양한 Super resolution 모델들의 성능을 비교 분석한다. 모델의 종류로는 Deep convolution neural network(심층 합성곱 신경망)를 기본 구조로 이루어진 SRCNN [1]. 이를 기반으로 이미지 생성 모델인 적대적 신경망(GAN, Generative adversarial network)모델인 SRGAN [2]이 발전한 Real-ESRGAN [3] 그리고 트랜스포머(Transformer) 기반의 SwinIR [4], HAT [5] 등이 있다. 위 모델들의 육안으로 보이는 성능, 모델의 무게를 나타내는 파라미터의 수, 모델을 학습하는데 걸리는 시간 과 학습된 모델이 테스트 이미지를 처리하는 시간을 비교 분석한다.
또한 Real-ESRGAN 모델에 Thermal dog and people dataset을 fine-tuning하여 열화상(Thermal, Infrared) 데이터를 입력 데이터로 필요로 하는 분야에 기존 사전학습 모델보다 뛰어난 열화상 사전학습 모델을 제안한다.
정보가 잘못된 경우 알려주세요!
목차
- 요약
- 1. 서론
- 2. 정량적 모델 비교
- 3. 정성적 모델 비교
- 4. Fine-Tuning
- 5. 미세조정 및 결과
- 참고문헌
참고문헌
참고문헌 신청최근 본 자료
UCI(KEPA) : I410-ECN-0102-2023-567-001938449