에피소드 매개변수 최적화를 이용한 확률게임에서의 추적정책 성능 향상

Improvements of pursuit performance using episodic parameter optimization in probabilistic games
韓國航空宇宙學會誌 第40卷 第3號, 2012.3, 215-221 (7 pages)
인용정보 복사
Quick View Quick View
구매하기 6,000원
인용하기
이용수 : 63건
피인용수 : 0건
분야내 활용도 : 15%
자세히 보기 >

· 이용수 : 2010년부터 집계한 원문다운로드수

· 피인용수 : DBpia 논문 가운데 해당 논문을 인용한 논문수

· 분야내 활용도 : 최근 24개월간 DBpia 이용수를 기준으로 산출 / 0%에 가까울 수록 활용도가 높고, 100%에 가까울 수록 활용도가 낮음

초록
In this paper, we introduce an optimization method to improve pursuit performance of a pursuer in a pursuit-evasion game (PEG). Pursuers build a probability map and employ a hybrid pursuit policy which combines the merits of local-max and global-max pursuit policies to search and capture evaders as soon as possible in a 2-dimensional space. We propose an episodic parameter optimization (EPO) algorithm to learn good values for the weighting parameters of a hybrid pursuit policy. The EPO algorithm is performed while many episodes of the PEG are run repeatedly and the reward of each episode is accumulated using reinforcement learning, and the candidate weighting parameter is selected in a way that maximizes the total averaged reward by using the golden section search method. We found the best pursuit policy in various situations which are the different number of evaders and the different size of spaces and analyzed results.

본 논문에서는 추적-회피 게임에서 추적자의 추적성능을 향상시키기 위한 최적화 기법을 소개한다. 제한된 공간상에서 추적자는 도망자를 빠른 시간 내에 찾아내고 잡기 위해 확률맵을 생성하고 그 확률정보를 토대로 탐색한다. 추적자는 기존 global-max와 local-max의 장점을 취한 hybrid 추적방식을 사용하는데 이 추적방식은 global-max와 local-max 성향을 조절하는 가중치를 갖는다. 따라서 상황별 최적의 가중치를 찾기 위해 에피소드 매개변수 최적화 알고리즘을 제안하였다. 이 알고리즘은 가중치에 대한 다수의 추적-회피 게임 에피소드를 반복적으로 수행하는 동안 강화학습을 통해 보상을 누적한 후 해당 가중치의 평균보상을 최대화 하는 방향으로 황금분할법을 사용하여 최적의 가중치를 찾는다. 이 최적화 기법을 이용하여 여러 상황별 최적 추적정책을 찾기 위해 도망자 수와 공간의 크기를 변화시켜가며 각각 최적화를 수행하였고 그 결과를 분석하였다.

목차
ABSTRACT
초록
Ⅰ. 서론
Ⅱ. 추적-회피 게임 설정
Ⅲ. 확률기반 추적-회피 게임
Ⅳ. 에피소드 매개변수 최적화
Ⅴ. 강화학습을 통한 최적정책
Ⅵ. 결론
후기
참고문헌
키워드
참고문헌 (10)

현재 논문의 참고문헌을 찾아 신청해주세요!

  1. Isaacs, R. , 1965 , Differential games: a mathematical theory with applications to warfare and pursuit, control and optimization , Wiley

  2. Vidal, R. , 2002 , Probabilistic pursuit-evasion games: theory, implementation, and experimental evaluation , IEEE Trans. on Robotics and Automation 42 : 662 ~ 669

  3. Schenato, L. , 2005 , Swarm coordination for pursuit evasion games using sensor networks , Proceedings of the 2005 IEEE International Conference on Robotics and Automation : 2493 ~ 2498

  4. Kwak, D. , 2009 , Probabilistic Pursuit-Evasion Game , Proceedings of KACC

  5. Kwak, D. , 2009 , Probabilistic Pursuit-Evasion Game , Proceedings of KSAS Fall 2009 Conference : 709 ~ 712

  6. Kwak, D. , 2011 , Probabilistic Pursuit-Evasion Game using Reinforcement Learning , Proceedings of KSAS Fall 2011 Conference

  7. I. D. Couzin , 2005 , Effective leadership and decision-making in animal groups on the move , Nature 433 (7025) : 513 ~ 516

  8. Khosla, P. , 1988 , Superquadric artificial potentials for obstacle avoidance and approach , Proceedings of the 1988 IEEE International Conference on Robotics and Automation : 1778 ~ 1784

  9. Sutton, R. S. , 1998 , Reinforcement learning: an introduction , MIT Press

  10. Press, W. H. , 1992 , Numerical recipes in C: The art of scientific programming , Cambridge University Press

인용된 논문 (0)

알림서비스 신청하고 '인용된 논문' 정보를 메일로 확인 하세요!

해당 논문은 인용된 논문 정보가 없습니다.

제 1 저자의 다른 논문 (6)

곽동준 식별저자 저자의 상세정보를 확인해 보세요.

권호 내 다른 논문 (11)

韓國航空宇宙學會誌 第40卷 第3號 의 상세정보를 확인해 보세요.

  • 처음
  •  
  • 이전
  •  
  • 1
  •  
  • 2
  •  
  • 다음
  •  
  • 마지막
추천 논문 (5)

DBpia 추천논문과 함께 다운받은 논문을 제공합니다. 논문 초록의 텍스트마이닝과 이용 및 인용 관계 분석을 통해 추천해 드리는 연관논문을 확인해보세요.

DBpia 추천논문

더 많은 추천논문을 확인해 보세요!

함께 다운받은 논문

해당 논문은 함께 다운받은 논문 정보가 없습니다.

지표

이용현황

· 이용수

· 이용순위 상위 Top3

자세히 보기 >
No 상위 이용이관 이용수
1 서울대학교 10
2 한국과학기술원 7
3 인하대학교 3

활용도

· 활용지수

· 논문의 활용도 추이 (주제분야 기준)

자세히 보기 >

: %

2016-09
2016-10
2016-11
2016-12
0
20
40
60
80
100
  • 0%
  • 20%
  • 40%
  • 60%
  • 80%
  • 100%

인용수

상세정보
저작권 정책

누리미디어에서 제공되는 모든 저작물의 저작권은 원저작자에게 있으며, 누리미디어는 각 저작물의 내용을 보증하거나 책임을 지지 않습니다. 단, 누리미디어에서 제공되는 서지정보는 저작권법에 의해 보호를 받는 저작물로, 사전 허락 없이 임의로 대량 수집하거나 프로그램에 의한 주기적 수집 이용, 무단 전재, 배포하는 것을 금하며, 이를 위반할 경우, 저작권법 및 관련법령에 따라 민, 형사상의 책임을 질 수 있습니다.

맨 위로 이동
  • 개인회원으로 로그인하셔야 이용이 가능합니다.
  •  개인회원
  •  기관회원
  • 소속기관
  • 아이디
  • 비밀번호
  • 개인회원가입으로 더욱 편리하게 이용하세요. 일반회원 가입하기

    아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기