인문학
사회과학
자연과학
공학
의약학
농수해양학
예술체육학
복합학
지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
논문 기본 정보
- 자료유형
- 학술대회자료
- 저자정보
- 발행연도
- 2023.2
- 수록면
- 642 - 647 (6page)
이용수
초록· 키워드
Dall-E 이후 거의 무한대의 주제 조합이 가능하며, 인간 능력을 상회하는 높은 수준의 이미지 생성이 가능한 확산모델 (diffusion model) 이 등장해 많은 관심을 끌고 있다. 이들 모델은 text-to-image 형식에 기반한 입력을 요구하나 사용자의 입장에서는 어떤 언어 구문의 조합이 자신이 원하는 주제와 스타일의 그림을 생성하는데 적합한지 실행해 보기 전에는 알 수 없다는 한계를 갖는다. 이를 극복하기 위해 사용자들은 온라인 커뮤니티 활동을 통해 수많은 시행착오를 거치며 적합한 텍스트 프롬프트를 발견하고, 공유하고, 개선하기 위한 체계적인 노력을 기울이고 있으며, 그를 통해 여러 텍스트 프롬프트 엔지니어링 툴도 집단지성을 통해 개발해 나가고 있다. 본 논문에서는 어떻게 사용자들이 어떠한 과정이나 흐름을 거쳐 이처럼 거대한 잠재공간을 가진 모델을 탐색하고, 사용하기 위해 노력하는지 분석하였다. 이를 위해 AI를 이용한 만화풍 이미지 생성에 대해 활발한 논의가 진행되고 있으며 Tag Generator 라는 텍스트 프롬프트 입력을 위한 툴을 만든 아카라이브 AI 그림 채널을 연구장소로 선정하였다. 연구대상으로는 78,911 개의 게시글을 수집했고, 근래 확산모델의 프롬프트 실행에 관한 시행착오와 인터페이스의 디자인과 밀접히 관련된 게시글 1,068 개를 추출하여 분석하였다. 이를 바탕으로 주제분석 방법을 통해 사용자의 행동 패턴과 관련된 8 개의 유형과 25 개 범주로 분류했다. 또, 사용자에 의해 소개된 이미지 생성 AI 보조 서비스가 8 개의 행동 패턴 유형 중 어떤 유형에 해당하는지 분석했고, 이를 바탕으로 대규모 확산모델 AI 에 근간한 이미지 생성 서비스의 UI/UX 개선을 위한 실천적 방안을 제안하였다.
상세정보 수정요청해당 페이지 내 제목·저자·목차·페이지정보가 잘못된 경우 알려주세요!
목차
- 요약문
- 1. 서론
- 2. 이론적 배경 및 현황
- 3. 연구 방법 및 결과
- 4. 논의 및 제언
- 5. 결론
- 참고문헌