메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
민대홍 (고려대학교) 정근우 (고려대학교) 권기영 (고려대학교) 박주영 (고려대학교)
저널정보
한국지능시스템학회 한국지능시스템학회 학술발표 논문집 한국지능시스템학회 2011년도 춘계학술대회 학술발표논문집 제21권 제1호
발행연도
2011.4
수록면
67 - 70 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
강화학습(reinforcement leaning)은 최근에 이루어진 비약적인 이론적 발전에 힘입어 계산 지능(computational intelligence) 분야의 핵심적인 주제의 하나로 자리 잡아 가고 있다. 현재 강화학습 기법은 가치함수(value function)를 기반으로 하는 방법, 액터-크리틱(actor-critic) 기법, 그리고 정책(policy)의 파라메터를 직접 탐색하는 기법 등의 방향으로 계속적인 발전을 이루어 가고 있으며, 특히 최신 강화학습 기법들은 각종 공학 문제에 우수한 성능을 보이며 적용되는 경향을 보여주고 있다. 본 논문에서는 최신 강화학습 기법들 중 공학적 활용성이 뛰어난 것으로 판단되는 e-NAC(episodic natural actor-critic) 알고리즘을 간단히 소개하고 이를 적절히 수정한 후 이동로봇의 경로추종제어문제(path following control task)에 적용하는 문제를 고려한다. 시뮬레이션 결과는 본 논문에서 고려한 수정된 e-NAC 알고리즘이 이동로봇제어문제에서 고전적인 PD 제어기에 비해 개선된 성능을 제공함을 보여준다.

목차

요약
1. 서론
2. 액터-크리틱 전략과 NAC 기법
3. 이동로봇의 경로추종 제어 문제를 이용한 성능평가
4. 결론 및 향후 연구 과제
참고문헌

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2012-028-004252836