ETRI GPU 서버 BeckendAI 사용방법

제목:
GPU 서버 계정 생성 완료 및 사용 방법 공유
보낸 사람:
신익수 <>
날짜:
2022-01-17 오후 4:51
받는 사람:
조창식 <>, 곽지영 <>, 김선태 <>, 김홍숙 <>, 석진욱 <>, 이경희 <>, 조현우 <>, 박재복 <>, 어준선 <>, 조성원 <>

지난주 금요일 GPU 서버에 Backend.ai 설치가 끝났습니다.
설치 후에 간단한 사용방법에 대해 교육을 받았는데
Backend.ai를 통해서 서버를 사용하실 수 있도록 사용 방법 공유해드립니다.
전체적인 과정은 구글 클라우드 사용 방식과 비슷한 것 같습니다.

Backend.ai 접속은 웹을 통해 진행됩니다.
웹브라우저 주소창에 129.이오사.182.이이육:8080 입력하시고 ID, PW 넣으신 후 접속하시면 됩니다.
(혹시 보안에 걸릴지 몰라서 IP는 한글과 숫자를 혼용했습니다.)
ID, PW는 아래와 같이 만들어 두었습니다.

ID: 개인별 etri 이메일 (ex. )
PW: etriuser1! (패스워드는 접속하신 후에 변경해주시기 바랍니다.)

사용방법은 2단계에 걸쳐 진행됩니다.

1. 데이터&폴더 생성
이 단계에서는 다음 단계에서 세션을 생성할 때, 마운트할 디렉토리를 만듭니다.
세션 생성 후에 디렉토리를 생성해도 되는데 이 단계를 먼저 하는 이유는
서버 사용 후에 세션을 종료하면 작업했던 데이터들이 모두 삭제되는데
마운트시킨 디렉토리의 정보는 삭제되지 않기 때문입니다.

절차
1. (그림1 참조) 왼쪽 카테고리 중 데이터&폴더 클릭
2. (그림2 참조) 오른쪽 중간의 새 폴더 클릭
3. (그림3 참조) 디렉토리 정보 입력. 종류에서 사용자를 선택하면 개인 디렉토리가 되고 프로젝트를 선택하면 프로젝트에 포함된 사용자들과 공유가 됩니다.
권한에서 읽기, 쓰기 권한을 선택할 수 있습니다.

2. 세션 생성
이 단계에서 서버의 자원을 할당받습니다.

절차
1. (그림4 참조) 왼쪽 카테고리에서 세션 클릭
2. (그림5 참조) 오른쪽 중간의 시작 클릭
3. (그림6 참조) 세션 정보 입력. Tensorflow나 Pytorch가 설치된 이미지가 준비되어 있습니다. Tensorflow 버전은 2.6 버전이고, pytorch는 1.11 버전입니다.
Tensoflow 1.15 버전도 있습니다. 선택하신 후 아래에 있는 화살표 클릭.
4. 1단계에서 만들어 둔 디렉토리 중 마운트시킬 디렉토리를 선택합니다. 선택하신 후 아래에 있는 화살표 클릭
5. (그림7 참조) 사용할 자원량 선택. CPU, 메모리, GPU 등 사용할 자원을 결정합니다. 사용자나 그룹별로 자원 사용량을 제한할 수 있지만 현재는 걸려있는 정책이 없습니다. 자원 할당에서 대략적인 사용량을 정할 수 있고, 사용자 설정 자원 할당에서 세부적으로 결정할 수 있습니다.
6. 검토 및 시작 클릭 후, 최종 정보 확인 및 시작 클릭
7. (그림8 참조) Console, Visual Studio Code, JupyterLab, Jupyter Notebook 가운데 사용할 인터페이스를 선택.
아래쪽에 TensorBoard와 NNI Board, MLFlow UI는 세션에 들아가셔서 각각을 실행시킨 후에 사용이 가능합니다.

3. 기타
이미지넷 데이터를 포함하하고 있는 디렉토리를 공유하도록 초대를 보내드렸습니다.
요약 페이지의 초대에서 수락하시면 해당 디렉토리를 마운트할 수 있습니다.
프로젝트용 디렉토리로 만들면 됐는데 개인용 디렉토리로 만들다 보니 공유로 보내드리게 되었습니다.
향후에 프로젝트용 디렉토리를 다시 만들어야 할 것 같습니다.

신익수 드림.

(그림1)
(그림2)
(그림3)
(그림4)
(그림5)
(그림6)
(그림7)
(그림8)

GPU 서버 계정 생성 완료 및 사용 방법 공유.pdf - 본문의 그림 포함 (711.468 KB) Jinwuk Admin, 2022/01/29 18:02

클립보드 이미지 추가 (최대 크기: 977.563 MB)