메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
김병필 (한국과학기술원)
저널정보
한국정보법학회 정보법학 정보법학 제26권 제1호
발행연도
2022.4
수록면
173 - 217 (45page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (5)

초록· 키워드

오류제보하기
이 글은 대규모 언어모형 인공지능과 관련된 주요한 법적 쟁점을 개괄한다. ‘언어모형(language model)’이란 어떤 문장이 존재할 확률 분포를 계산해 내는 통계 모형을 의미한다. 딥러닝 기법을 활용한 대규모(large-scale) 언어모형은 현재 인공지능이 자연어를 이해하고 새로운 말과 글을 생성해 내는 여러 과제에 있어 공통으로 활용되는기본적 수단이 되고 있다. 그러나 대규모 언어모형의 개발, 학습, 활용에 있어 여전히상당한 법적 불확실성이 존재하며, 이를 해소하기 위한 여러 노력이 요구된다. 이 글이 분석한 대규모 언어모형 인공지능의 법적 쟁점은 크게 3가지이다. ① 대규모 언어모형의 학습데이터 확보 과정과 관련된 법적 쟁점이 있다. 언어모형의 학습데이터는 주로 웹 스크래핑을 통해 확보되는데, 이 과정에 있어 저작권과 데이터베이스제작자의 권리와 공정이용의 범위, ‘정보통신망 침해’에 대한 해석, 반경쟁적인 웹 스크래핑 제한 조항에 대한 공정거래법?약관법상 규율, 웹 스크래핑을 통한 다른 이용자의 프라이버시 침해 문제 등 다양한 법적 쟁점이 다층적으로 얽혀 있다. ② 대규모언어모형은 학습데이터에 포함된 개인정보를 암기하여 이를 그대로 재현해 낼 위험이 지적된다. 따라서 그 학습데이터에 개인정보가 포함되지 않도록 적절한 비식별조치 또는 가명처리를 취할 필요가 있다. ③ 대규모 언어모형은 학습데이터에 포함된사회의 기존 편향?편견이 반영된 텍스트, 차별적 발언 또는 혐오 표현을 그대로 재현할 위험이 있다. 언어모형에 반영된 편향이 초래하는 위해는 장기적, 확산적, 문화적 성격을 갖고, 개별 피해자를 특정하기도 어려운 특징을 가지므로, 이를 법적으로규율하는 것은 매우 어렵다. 이에 따라 인공지능 개발자나 서비스 제공자들에 의한자율 규제 또는 언어모형의 편향을 예방하거나 제거하기 위한 여러 기술적 시도들이진행 중이다.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0