메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
심유라 (한양대학교) 김영훈 (한양대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회 컴퓨팅의 실제 논문지 정보과학회 컴퓨팅의 실제 논문지 제29권 제1호
발행연도
2023.1
수록면
55 - 60 (6page)
DOI
10.5626/KTCP.2023.29.1.55

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 자연어 처리에서 트랜스포머 계열의 네트워크가 뛰어난 성능을 발휘하고 있다. 그에 따라 트랜스포머의 구조를 일부 변형하여 만든 언어 모델인 BERT 또한 많은 자연어 처리 태스크에서 사용되고, 좋은 결과를 보여주고 있다. BERT는 셀프 어텐션을 통해 문맥 정보를 담아서 임베딩 벡터를 인코딩 하는데, 이 과정에서 관련 있는 단어의 임베딩 벡터들이 유사해진다. 이는 단어들 사이의 코사인 유사도를 통해 알 수 있는데, BERT의 초기 계층에서는 문맥 정보가 담기지 않아 단어 사이의 코사인 유사도가 낮지만, 뒤쪽 계층으로 갈수록 셀프 어텐션을 통해 문맥 정보가 추가되면서 단어 사이의 코사인 유사도가 높게 나오는 것을 알 수 있다. 하지만 높은 코사인 유사도 값을 가지게 되는 것에 있어서 임베딩 벡터의 특정 차원이 지배적인 역할을 한다는 연구가 존재한다. 본 연구에서는 그러한 차원이 문맥 정보를 포함하는 것에 어떤 영향을 미치는지를 확인하기 위해 그러한 차원을 지우기 전과 후의 단어 임베딩 벡터를 클러스터링한 후 두 결과를 비교하여 확인하였다.

목차

요약
Abstract
1. 서론
2. 관련 연구
3. 해석 모델 및 데이터
4. BERT 임베딩 벡터의 코사인 유사도
5. 코사인 유사도를 지배하는 차원이 클러스터링에 미치는 영향
6. 특이 차원을 지운 후 클러스터 결과에 대한 자카드 유사도
7. 결론
References

참고문헌 (9)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0