메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
이강훈 (서울대학교) 김기범 (서울대학교) 한동식 (서울대학교) 장병탁 (서울대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회 컴퓨팅의 실제 논문지 정보과학회 컴퓨팅의 실제 논문지 제29권 제2호
발행연도
2023.2
수록면
83 - 88 (6page)
DOI
10.5626/KTCP.2023.29.2.83

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
일화기억은 생명체의 개인적 경험에 대한 기억으로 뇌의 해마(hippocampus)에서 주로 관여하며 경험을 통한 학습을 가능하게 한다. 일화기억은 발생 당시에 유발된 감정에 따라 보상기억과 부정기억으로 구분된다. 각 기억들은 뇌의 기저측편도(basolateral amygdala) 부근에서 교차된 보상회로와 부정회로를 통해 각각 저장된다. 본 논문에서는 상기한 생물학적 합의를 바탕으로, 분기된 일화기억에 기반하여 정책을 학습하는 방법인 행동-대조학습을 제안한다. 행동-대조학습에서는 환경에서 제공되는 보상의 성격에 따라 보상기억과 부정기억에 나누어 저장하고 보상기억에서의 행동은 강화하도록, 부정기억에서의 행동은 약화하도록 학습한다. 실험을 통해 제안된 방법으로 학습한 정책이 MNIST 환경과 Atari Pong 환경에서 보상을 획득하는 방향으로 행동함을 확인하였다. 또한, saliency map 분석을 통해 정책이 행동을 선택하는 근거의 타당성을 확인하였다.

목차

요약
Abstract
1. 서론
2. 행동-대조학습
3. 실험 및 결과
4. 분석
5. 결론
References

참고문헌 (12)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0