강화 학습(Reinforcement Learning) 개념

에이전트(Agend)가 일련의 단계(State)에서 주어진 목표/보상(Objective/Reward)를 최대화하기 위해 환경(Environment)에서 동작(Action)하는 기계학습(Machine Learning)의 한 종류

강화학습 프로세스 (source : GCP Qwiklabs)

 

구글 클라우드 플랫폼에서 강화학습(Reinforcement Learning) Job을 동작하기 위해 아래의 소스파일과 셸 커맨드를 참고하여 실습할 수 있음

구글 클라우드 플랫폼 기반 강화학습 (source : GCP Qicklabs)

 

GCP 에서 강화학습 실습하기

 

1. 탐색 메뉴에서 > AI Platform > Notebooks 를 선택

 

2. 상단 메뉴바에서 + 새 인스턴스 만들기 (New Instance) > 텐서플로우 2.1 (Tensorflow 2.1) > GPU 없는 버전(Without GPUs) 선택

 

3. 생성된 노트북 확인 후, 주피터 랩 열기 (OPEN JUPYTERLAB) 버튼 클릭

 

4. 터미널 (Terminal) 아이콘 클릭 하여 터미널 창에서 아래 명령어를 실행하여 Git으로부터 자원, 소스코드 복제(clone) 하기

git clone https://github.com/GoogleCloudPlatform/training-data-analyst.git

 

 

5. 좌측 탐색창에서 training-data-analyst > quests > rl > early_rl > early_rl.ipynb 순서로 선택

early_rl.html
0.35MB

 

 

6. 새창에 표시된 노트북 확인 가능. 각 코드 블럭에서 Shift + Enter 를 클릭하여 실행 가능

  ※ 주의사항 : 라이브러리 설치를 위한 첫번째 코드 블럭 실행 후 설치 완료를 위해, 커널 재시작 (Restart the kernel) 필요

early_rl_run.html
0.37MB

 

구글 클라우드 플랫폼에서 강화학습 예제 노트북 실행화면 

 

+ Recent posts