인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술저널
- 저자정보
- 발행연도
- 2025.4
- 수록면
- 143 - 154 (12page)
이용수
초록· 키워드
본 논문은 최근 주목받고 있는 검색 증강 생성(RAG) 시스템의 성능 평가를 위한 테스트 데이터셋 생성 방법을 비교 분석하였다. 대규모 언어 모델(LLM)의 한계를 극복하는 RAG 기술의 필요성과 중요성을 설명하고, 수동 생성 방식과 LLM을 활용한 자동 생성 방식의 특징과 장단점을 정리하였다. 또한 자동화된 데이터셋 구축 프레임워크 중 RAGAS, AutoRAG, DeepEval을 선정하여 의료,금융,법률 문서를 입력으로 각각 100개의 질문-답변 세트를 생성한 후 정확성을 평가하였다. 평가 결과, AutoRAG가 한국어 문장 표현의 자연성과 컨텍스트 기반의 정확성 측면에서 가장 뛰어난 성능을 보였으며, RAGAS는 문서 처리 과정에서 불필요한 정보 포함 등의 오류가 많았고, DeepEval은 한국어 지원 부족으로 인해 성능이 상대적으로 낮았다. 향후 연구에서는 LLM을 활용하여 사용자의 의도와 컨텍스트를 더욱 정확히 반영하는 고급 프롬프팅 기법과 자동화된 데이터 품질 평가 및 개선 전략을 중점적으로 탐색할 계획이다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- 요약
- Abstract
- 1. 서론
- 2. 데이터 셋 생성 방법론
- 3. 프레임워크 개요
- 4. 연구 방법
- 5. 결과
- 6. 결론
- REFERENCES
참고문헌
참고문헌 신청최근 본 자료
UCI(KEPA) : I410-151-25-02-092925953