인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
초록· 키워드
자율형 AI 에이전트의 보안 위협은 전통적인 언어 모델의 탈옥 (Jailbreak)이나 유해 콘텐츠 생성과 같은 출력 수준의 문제를 넘어, 시스템 권한 오남용과 호스트 환경 변조로 이어지는 행위적 위협으로 진화하고 있다. 본 연구는 최신 에이전트 보안 연구와 기술 문서를 신뢰 경계 (Trust Boundary) 관점에서 재구성하여, 에이전트의 보안 위협을 1) 입력 및 실행 문맥, 2) 검색 및 지식 베이스, 3) 외부 도구 및 함수 호출, 4) 프로토콜 및 에이전트 연동, 5) 권한 및 런타임 실행, 6) 상태 및 장기 메모리의 여섯 가지 공격 표면으로 체계화한다. 분석 결과, 간접 프롬프트 주입, RAG 기반 지식 오염, 도구 호출 오용, 권한 위임 혼동, 런타임 실행 취약점, 메모리 중독과 같은 공격은 서로 독립적으로 발생하지 않으며, 신뢰 경계를 따라 연쇄적으로 결합되어 시스템 수준의 침해로 확장될 수 있음을 확인했다. 또한, 본 연구는 에이전트 보안의 초점이 단순한 프롬프트 강건성 확보에서, 최소 권한 (Least Privilege)과 권한 중개 (Capability Mediation)에 기반한 시스템적 통제로 이동하고 있음을 보인다. 나아가 단일 턴 (Single-turn) 중심의 텍스트 조작을 넘어, 멀티턴 (Multi-turn) 실행 흐름과 지속 상태를 표적으로 하는 복합적 위협을 분석하고, 향후 해결해야 할 주요 과제로 권한 위임 모델의 명확화, 모듈 결합 기반 복합 공격 분석, 다단계 실행 흐름의 동적 평가, 메모리 무결성 확보를 제시한다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- 요약
- Ⅰ. 서론
- Ⅱ. 위협 모델
- Ⅲ. 간접 프롬프트 주입 공격
- Ⅳ. 검색 및 지식베이스 공격
- Ⅴ. 외부 도구 및 함수 호출 취약점
- Ⅵ. 프로토콜 및 다중 에이전트 연동 취약점
- Ⅶ. 권한 및 런타임 실행 표면 내 취약점
- Ⅷ. 메모리 및 멀티턴 취약점
- Ⅸ. 논의 및 향후 과제
- Ⅹ. 결론
- 참고문헌