인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
개인구독
소속 기관이 없으신 경우, 개인 정기구독을 하시면 저렴하게
논문을 무제한 열람 이용할 수 있어요.
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수
초록· 키워드
광학 위성 영상(Optical)과 합성개구레이더(SAR)를 함께 사용하는 다중소스 객체 검출 연구가 활발히 진행되고 있으나 대부분은 이미지 특징 융합에만 집중하여 클래스 의미 정보를 충분히 활용하지 못한다. M4-SAR[1]는 정렬된 Optical-SAR 쌍과 대규모 회전 박스 주석으로 구성된 대표 벤치마크이다. 본 연구에서는 E2E-OSDet[1]에 비전-언어 모델(VLM)의 텍스트 임베딩을 결합한 TA-OSDet를 제안하고 클래스별 텍스트 프로토타입과 이미지 컨텍스트를 검출 헤드의 분류 로짓과 융합하는 Text Fusion Module을 도입하였다. TA-OSDet는 AP@0.5 = 85.7%, AP@0.75 = 71%, mAP@0.5:0.95 = 61.7%을 달성하며 비전-언어 기반 텍스트 융합의 효과를 확인하였다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- Abstract
- 요약
- Ⅰ. 서론
- Ⅱ. 관련 연구
- Ⅲ. 제안 기법
- Ⅳ. 실험 결과
- Ⅴ. 결론
- References