인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술저널
- 저자정보
- 저널정보
- Korean Institute of Information Scientists and Engineers Journal of KIISE Journal of KIISE Vol.52 No.11
- 발행연도
- 2025.11
- 수록면
- 940 - 947 (8page)
- DOI
- 10.5626/JOK.2025.52.11.940
이용수
초록· 키워드
광학 문자 인식(OCR)은 이미지 내 텍스트를 기계가 읽을 수 있도록 변환하는 기술로, 문서 관리가 중요한 산업에서 널리 활용된다. 그러나 한글은 자모가 결합된 복잡한 구조로 인해 인식 정확도가 낮으며, 이를 개선하려면 11,172개의 완성형 글자를 포함하는 방대한 데이터셋이 필요하다. 또한, 띄어쓰기, 맞춤법 오류뿐만 아니라 문자 왜곡과 손상 등의 오류 패턴이 존재해 기존 맞춤법 검사 모델을 활용한 후처리가 어렵다. 이를 해결하기 위해 본 논문에서는 초거대 언어 모델을 활용한 퓨샷 학습과 프롬프트 엔지니어링을 제안한다. 연구 결과, 기본 프롬프트 대비 오류 교정 정확도가 최대 18.18% 향상되었으며, 텍스트 손상 복원과 띄어쓰기 오류 교정에서도 각각 21.6%, 17.26%의 성능 개선이 확인되었다. 이는 적은 예시만으로도 한글 OCR 오류를 효과적으로 교정하고 손상된 텍스트를 복원할 수 있음을 입증한다.
#OCR 후처리
#한글 OCR 오류 교정
#프롬프트 엔지니어링
#초거대 언어 모델
#OCR post-processing
#Korean OCR error correction
#Prompt engineering
#LLM
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- 요약
- Abstract
- 1. 서론
- 2. 관련 연구
- 3. 실험
- 4. 실험 결과
- 5. 결론
- References
참고문헌
참고문헌 신청최근 본 자료
UCI(KEPA) : I410-151-26-02-095595434